@ghost1511: No to może jeszcze ważne pytanie - czy angielski jest ok? Jeśli znasz średnio to polecam bardzo konkretnie się do niego przyłożyć - bez tego Twoje szanse na zostanie DSem są prawie zerowe.

Jeśli chodzi o ogólny pogląd na temat to polecam zacząć od:
O'Reliego http://math-cs.gordon.edu/courses/cps352/2015-spring/resources/big-data-now-2014-edition.pdf

Dodatkowo warto od czasu do czasu wejść na stronkę:
http://www.datasciencecentral.com/

Tu, jakiś szerszy tutorial: http://www.datasciencecentral.com/profiles/blogs/how-to-become-a-data-scientist-for-free

Tu trochę więcej o ichnim programie: http://www.datasciencecentral.com/group/data-science-apprenticeship

Dodatkowo polecam
Znacie jakieś narzędzie (najlepiej darmowe o ile jest) do monitorowania baz danych mssql.
Mam cztery bazy. Akurat złożyło się, że w wersjach MS 2005,2008R2 x2,2012.
Chciałbym je w jakiś sposób monitorować.(ilosc zapytan,cpu,pamiec,i/o)
Aktualnie loguję się na każda i odpalam activity monitor co jakiś czas.
Może być web, desktop obojętne
#informatyka #bazydanych #mssql #januszeadministracji
Mirki, możliwe że czegoś nie pamiętam, albo dziś już nie myślę. Więc może ktoś będzie w stanie podpowiedzieć.
Tabela o strukturze powiedzmy
id, name, visible, parent. Relacja unarna, na polu parent. Czy jest jakiś łatwy i cwany sposób na sprawdzenie czy żaden z parentów nie ma ustawionego visiblity na 0? Zaznaczę MySql + pgSql.
#bazydanych #programowanie
Cześć koledzy wcześniej już pisałem o moim problemie i pomogliście mi go rozwiązać teraz muszą trochę rozbudować moje zapytanie więc proszę was o pomoc. Ale do rzeczy mam taką tabelę

ID Name
1 art
1 sss
1 dss
1 ffr

2 sss
2 dss

3 saa
3 ftrt
3 sss

4 sss
4 dsff

Wcześniej potrzebowałem wyciągnąć z niej IDki, które mają Name równe 'sss' i 'dss'. Na podstawie pomysłu kolegi
@bziuuumor: Nie steruje się sqlemna tak niskim poziomie w ciemno, serwer wie co robi. W Postgresie plan sobie możesz tym zepsuć, w innych bazach też to nie pomoże (a jeśli pomoże to znaczy że równie dobrze może zaszkodzić).
@bziuuumor: IN i DISTINCT powinny się w zachowywać identycznie w większość współczesnych baz danych. DISTINCT w podzapytaniu natomiast wymusza materializację, w pg zalecane zamiast tego jest OFFSET 0, ale to tylko w ekstremalnych wypadkach gdy chcemy wymusić plan zapytania czego nie należy robić.
Witam. Korzystam z programu opartego o bazę danych FireBird 2.5.2. (Super Sever). Serwer baz danych postawiony jest na serwerze w innej lokalizacji. Łączę się z nią za pomocą VPN na łączach Orange (4/4MBit/s). Na serwerze program śmiga. Na zdalnym kliencie jest masakra. Samo logowanie do programu to jakieś 2 minuty. Przeglądając zasoby serwera jak i klienta, uruchomienie programu nie robi na nich żadnego wrażenia - nie skacze zużycie procesora/RAM. Wolnych zasobów na
@Login_login: Opóźnienia zabijają bazę. Firebird dobrze działa w lokalnym środowisku gdzie opóźnienia są poniżej 1 ms - ona nie nadaje się do pracy zdalnej - do takowej używa się np. MySQLa - bo tam można w prosty sposób łączyć zapytania niwelując opóźnienia.
@oggy1989: Malformed database to może być oznaka problemu z concurrent writes lub utrata zasilania w trakcie write lub natychmiastowe ubicie procesu przez coś.

Ja bym sugerował zapisywać dane do CSV i partycjonować wg dnia. Z CSV zaimportujesz na życzenie do każdej bazy jakiej będziesz potrzebował, a sam format dobrze poddaje się kompresji.
#sql #bazydanych #pomocy #informatyka

Mam zadanie:
Wyświetl średnią, najwyższą i najniższą kaloryczność napojów. Zmień nazwy kolumn na (odpowiednio) sredniakalorycznosc, maksymalnakalorycznosc, minimalnakalorycznosc.

O jakie kolumny chodzi, bo nie wiem. W skrypcie ich nie ma. Chodzi o to, żeby przy wyświetleniu widniały nazwy kolumn czy jak?

Skrypt:
# Tabela drinki_informacje
# ------------------------------------------------------------

CREATE TABLE
drinkiinformacje (
nazwa varchar(16) default NULL,
cena decimal(4,2) default NULL,
weglowodany decimal(4,2) default NULL,
kolor varchar(20)
@nnogi: @wytrzzeszcz: O projektowaniu? W sensie?
Nie wiem na co kolega chciałby aplikować, ale jeśli branża IT na juniora (bądź inne branże, już niekoniecznie na juniora) to w 90% przypadków wystarczy sensowne budowanie zapytań prezentujących na istniejącej bazie danych, ewentualnie proste insert, update.
Więc moim zdaniem zacznij od takich kwestii jak select, wszelkie joiny (+union), grupowanie, wielokrotnie grupowanie, wszelkie agregujące funkcje, sortowanie, wyszukiwanie po wartości/fragmencie wartości/wielokrotnych warunkach, podzapytania. Jeśli będzie
Mam tabelkę z danymi.
cashierid | cashiercompanyid | operationcode | eventticketid

Muszę wyciągnąć te dane z DB i stworzyć XML.
Struktura XML jest taka:


W jaki sposób wyciągnąć dane z bazy danych, aby później przy pomocy PHP mógłbym stworzyć taki XML? Teraz jeżeli zrobię zwykły SELECT (korzystam oczywiście z Active Record), to mogę wszystko zrobić "płaskie", a muszę zrobić zagnieżdżony XML.

#php #bazydanych #postgresql #mysql #
Baza danych waży kilkadziesiąt GB


@mariecziek: czyli niewiele ( ͡° ͜ʖ ͡°)

Co 15 min 500 użytkowników będzie zwracało się do systemu aby uzyskać najnowsze dane.


@mariecziek: pytanie numer jeden - po co im te dane i co tak naprawde potrzebuja. Bo jeśli kazdy potrzebuje co 15 minute pelnego dumpa bazy w XMLu, to coś tu jest nie halo.