Wpis z mikrobloga

Hej mirki, jest taka historia:

Jako, że może jeszcze nie jestem za stary żeby ruszyć w ten temat, przedstawiam Wam moją małą mapkę z planem na najbliższy rok w stronę Data Scientista. Jak pewnie wielu z was wie, droga to ciężka i zawiła, jednak jest to do osiągnięcia i takie tam.

Niestety ten program do mind map jest trochę z dupy i żeby podejrzeć linki które stworzyłem muszę tą mapę udostępnić, ludzie muszą mieć podlinkowany ten program pod konto googla, sratatata....

Więc żeby było łatwiej - wrzucam kilka linków (sporo z nich już się pojawiło pod tym tagiem, ale potraktujcie to jako wpis zbiorczy)

Python:

https://class.coursera.org/algo

https://class.coursera.org/algo2

https://university.mongodb.com/courses/M101P/about

http://learnpythonthehardway.org/book/intro.html

OFC polecam SciPy (ale to chyba trochę kapitan Obvious)

R:

https://www.coursera.org/course/rprog

http://it-ebooks.info/book/318/

http://www.r-project.org/ (na oficjalnej stronie dokumentacja jest całkiem spoko)

Dodatkowo do R dorzucam całkiem znośne IDE:

http://www.rstudio.com/

Data Science:

https://www.coursera.org/course/datasci

https://github.com/chaconnewu/free-data-science-books/blob/master/free-data-science-books.md#data-science-introduction

Data Visualisation:

https://infoactive.co/data-design/titlepage01.html

Podstawy Big Data:

bigdatauniversity.com/bdu-wp/bdu-course/big-data-fundamentals/

Hadoop:

http://hortonworks.com/get-started/ (tutaj do ściągnięcia jest virtualka z postawionym Hadoopem etc. Do tego sporo matsów na stronie)

MongoDB:

http://docs.mongodb.org/manual/tutorial/getting-started/

Dodatkowe matsy:

http://it-ebooks.info

Wołam @msq: Dzięki man! Sporo materiałów dostałem od tego pana, spropsujcie go dodatkowo.

Oczywiście, jak zapewne wszyscy wiedzą, na Courserze jest tych fajnych kursów więcej tak samo na bigdatauniversity i mongodbuniversity.

Pozdrawiam i przesyłam gorące buziaczki dla wszystkich mirków, których materiały wykorzystałem w tym wpisie.

Jakby ktoś chciał coś dodać to z chęcią przyjmę.

Miłej nauki 5!

#bazydanych #businessintelligence #datamining #datascience #statystyka
r.....h - Hej mirki, jest taka historia:



Jako, że może jeszcze nie jestem za stary...

źródło: comment_3FFCBzxLfwga0uMi4aes6hdDrjBo0i43.jpg

Pobierz
  • 14
@ri7h: Wygląda sensownie, ale z mojego punktu widzenia MongoDB to tak średnio ma po drodze z Data Science, a jeszcze mniej z Big Data. OK, nie powiem, że to złe rozwiązanie, ale jeśli mówimy o "petabyte scale" to zdecydowanie Cassandra albo HBase (kolejność według popularności). A potem na to wszystko jeszcze Spark.
@Qrystus: Tag DB i DS ma tak mało dodanych treści/subskrybentów, że będę raczej tam wrzucać info.

@Regis86: Psujesz mi wielki plan :(

Ale dzięki za info. Plan zapewne będzie się zmieniać w trakcie, w chwili obecnej mam zamiar skupić się na Pythonie/R i na tych językach przerobić statystykę/metody numeryczne. W międzyczasie polecę z podstawami z reszty działów. Btw, jak rozumiem - pracujesz w temacie? Albo chociaż jakoś blisko?
@ri7h: Mowilem Ci ze mongo to zuo :)

Jak juz bardzo chcesz skalowalne nosql db to zobacz na DynamoDB od amazona, choc nie wiem jak to jest ze skalowaniem sie powyzej jakiejs krytycznej granicy.

Tak jak Ci @Regis86 pisze - jest tendecja teraz do wykorzystania interfejsu SQL do przetwarzania i odpytywania wielkich ilosci danych. Spark, jako lepszy Hive to dobry przyklad.
@bazingaxl: Man, ale ja nie obiecuję sobie, ze w święta to ogarnę, jednak uważam, ze rok to akurat czas na dopracowanie Pythona i R do sensownego poziomu i załapanie podstaw technologii Apache. Trzymaj kciuki :P