Wpis z mikrobloga

Czy jest tu może osoba zajmująca się na co dzień tematyką związaną z #bigdata #datascience #machinelearning #analizadanych i mogłaby udzielić kilku wskazówek dla osoby dopiero wchodzącej w temat?

Od października zaczynam studia magisterskie na kierunki Big Data na SGH (inżyniera robiłem na zupełnie innym kierunku) i zastanawiam się jak najlepiej rozwijać się w tej branży. Z tego co wiem, na studiach będe miał możliwość poznania głównie języka R, SASa troche Pythona i SQL. Sam do tej pory programowałem trochę, ale w Javie, i zastanawiam się jak ten wolny czas dobrze spożytkować - czy dalej szlifując Jave, czy raczej zacząć naukę Pythona (bo często słyszę, że w tej branży to razem z R najpopularniejszy język)?

Mam też sporo wątpliwości, jakie w ogóle są ścieżki jeśli chodzi o rozwój w tego typu branży? Czy jest to stricte programowanie z wykorzystaniem Pythona, Javy, Scali, Hadoopa? Czy są również stanowiska, obszary gdzie nie jesteśmy skazani tylko na programowanie, ale również wyciąganie wniosków z tych danych? Od nauki czego wg was powinienem zacząć? ;)

I czy orientujecie się jak wygląda zapotrzebowanie na rynku pracy dla ludzi znających #sas lub język R (z tego co przeglądałem na portalach pracy, to raczej w większości jest to jeden z kilku narzędzi wymaganych oprócz scali, hadoopa itp)

Dodaje też #sgh #programowanie #java #python bo w jakimś stopniu też o tematykę zahacza :)

z góry dziękuje za wszelkie porady, odpowiedzi i rozjaśnienie tematu
  • 9
  • Odpowiedz
@wytrzzeszcz: Czy tylko mi wydaje sie dziwne skok w magisterkę bez przygotowania?
@mam_Cie_na_strzala: Big data jest ścieżką opierającą się na analizie dużych wolumenów danych. Bardziej niż technologie ważniejsze jest zrozumienie procesów i technik umożliwiających składowanie i analizowanie dużej ilości danych. Po drodze pewno poznasz parę języków ( jak np python i go ) i narzędzi ( takich jak SQL, Hadoop .. ), ale nadal najważniejsze jest zrozumienie sposobów podejścia do
  • Odpowiedz
@mam_Cie_na_strzala:

Generalnie data science to szerokie pojecie. W roznych firmach zatrudniaja DS i w ramach tej samej pozycji, zakres obowiazkow moze byc rozny (nawet w tej samej firmie). To co jest konieczne zeby byc DS to:
1. statystyka
2. SQL
3. znajomosc programowania - w stopniu pozwalajacym na samodzielne pisanie skryptow (Python lub R)

W takiej pracy beda wymagac duzej samodzielnosci w rozwiazywaniu problemow niescisle zdefiniowanych, a dane sa czesto nieustrukturyzowane
  • Odpowiedz
@mam_Cie_na_strzala: na sghu zbyt dużo programowania Cie nie nauczą, musisz sam się doszkalać, jeżeli chcesz przebierać w ofertach pracy. Radziłbym oprócz baz danych ogarnąć R i pythona. Sasa liźniesz na SGHu i jeżeli sam trochę ogarniesz język 4GL SASowy, to pojawiają się dodatkowe możliwości. Sam pracuję głównie z SASem, niestety stanowiska te zazwyczaj nie są ciekawe.
  • Odpowiedz