@msq:

Hive is Facebook's data warehouse, with 300 petabytes of data in 800,000 tables. Facebook generates 4 new petabyes of data and runs 600,000 queries and 1 million map-reduce jobs per day.


#!$%@?, zaraz chyba zejdę na zawał.
Mining of Massive Datasets

The book is based on Stanford Computer Science course CS246: Mining Massive Datasets (and CS345A: Data Mining).

The book, like the course, is designed at the undergraduate computer science level with no formal prerequisites. To support deeper explorations, most of the chapters are supplemented with further reading references.

http://mmds.org/

#bigdata #datascience #bazydanych #datamining

#msqspam
Hej mirki, jest taka historia:

Jako, że może jeszcze nie jestem za stary żeby ruszyć w ten temat, przedstawiam Wam moją małą mapkę z planem na najbliższy rok w stronę Data Scientista. Jak pewnie wielu z was wie, droga to ciężka i zawiła, jednak jest to do osiągnięcia i takie tam.

Niestety ten program do mind map jest trochę z dupy i żeby podejrzeć linki które stworzyłem muszę tą mapę udostępnić, ludzie
Pobierz
źródło: comment_3FFCBzxLfwga0uMi4aes6hdDrjBo0i43.jpg
dostałem, więc podam dalej.

Darmowy Salary Survey - Data Science

Two clusters of correlating tool use: one consisting of open source tools (R, Python, Hadoop frameworks, and several scalable machine learning tools), the other consisting of commercial tools such as Excel, MSSQL, Tableau, Oracle RDB, and BusinessObjects.


old skull vs new skull czy też startup vs korpo ?

#datascience #statystyka #pracazagranica #ciekawostka #programowanie