@ri7h: Ważne, że zacząłeś i ruszyłeś w ogóle. Ja się nie mogę zebrać do nauki ciekawych rzeczy, bo albo praca, albo studia, a technologia gna do przodu, a literatura i zabawki czekają.

W każdym razie nie poddawaj się i do przodu!
  • Odpowiedz
@ri7h: Jedna szybka uwaga o poranku - jeśli jednocześnie uczysz się od podstaw dwóch różnych technologii (ew. 2.5 jeśli SAS liczymy jak pół, bo nie zupełnie od podstaw ;-)), a do tego jeszcze robisz kilka różnych kursów na Courserze, to moim zdaniem za bardzo się "miotasz" - to daje pozory tego, że jesteś wydajniejszy niż robiąc jedną rzecz na raz, ale cierpi na tym jakość. Moim zdaniem pracodawcy będą preferować
  • Odpowiedz
@msq:

Hive is Facebook's data warehouse, with 300 petabytes of data in 800,000 tables. Facebook generates 4 new petabyes of data and runs 600,000 queries and 1 million map-reduce jobs per day.


K---a, zaraz chyba zejdę na zawał.
  • Odpowiedz
Mining of Massive Datasets

The book is based on Stanford Computer Science course CS246: Mining Massive Datasets (and CS345A: Data Mining).

The book, like the course, is designed at the undergraduate computer science level with no formal prerequisites. To support deeper explorations, most of the chapters are supplemented with further reading references.

http://mmds.org/
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@ri7h: Tak. Zajmuję się Big Data, nie do końca samym Data Science, ale mam na koncie tworzenie platformy typu "data analytics", a obecnie zajmuję się systemem, który jest backendem dla m.in. platformy tego typu.
  • Odpowiedz
dostałem, więc podam dalej.

Darmowy Salary Survey - Data Science

Two clusters of correlating tool use: one consisting of open source tools (R, Python, Hadoop frameworks, and several scalable machine learning tools), the other consisting of commercial tools such as Excel, MSSQL, Tableau, Oracle RDB, and BusinessObjects.


old
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach