Wpis z mikrobloga

#machinelearning #datascience #programowanie #bigdata #python #praktyki #warszawa #deeplearning

witam serdecznie, czy zna ktoś warszawską firmę, w której można by złapać praktyki/staż ( nawet bezpłatne, zależy mi na zdobyciu doświadczenia "od kuchni" ) w dziale analizy danych, tym słynnym Big Data, ewentualnie jakimś pokrewnym?

zawodowego doświadczenia nie posiadam, znam jednakże całkiem nieźle Pythona z całym arsenałem w postaci Numpy, Scikit-learn, Matplotlib, mam jakieś podstawy środkowiska R w głowie, umiem całkiem szczegółowo opisać, zaimplementować i z powodzeniem wykorzystać algorytmy machine learning ( swego czasu próbowałem pokonać indeks giełdowy, bez większych sukcesów - ale co się nauczyłem, to zostało w głowie ). aktualnie poprzez praktykę uczę się Deep Learning - zabrałem się za treningowy konkurs na Kaggle o wykrywaniu punktów charakterystycznych twarzy.

ktoś, coś?

uprzedzając oskarżenia o nieróbstwo i wysługiwanie się wykopkami - samodzielne poszukiwania również prowadzę, po prostu zwiększam liczbę kanałów informacyjnych ;)
  • 16
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@phogel: Trzeba dane obrobić, zapewnić odpowiednią wydajność (nie, nie wszystko zawsze od ręki działa bez przestawiania). "Naukowcy danych" nieraz piszą całe programy w Javie/Scali, więc sama znajomość statystyki i R/Pythona jest na nic (w czystym R/Pythonie raczej zbioru 1 TB nie obrobisz szybko).

Jednym słowem: Data Scientist = statystyka i uczenie maszynowe + programowanie + znajomość odpowiednich frameworków/podejść.

Dobry statystyk może nie poradzić sobie z środowiskiem rozproszonym, dobry programista może
  • Odpowiedz
@czlowiek_rakieta: wszystkie Telekomy, HP ostatnio szukało, WLOG Solutions sprawdź, widziałem oferty stażowe ze start-upu nPOWERED, na datawerq też widziałem jakąś mniejszą polską firmę ostatnio, zapomniałem nazwy
  • Odpowiedz
@czlowiek_rakieta Generalnie warto sprawdzać ogłoszenia o pracę np. na NoFluffJobs i aplikować tam, gdzie podają jakieś języki i frameworki z Data Science / Big Data - Apache Spark, R. Wtedy wiesz, że takie projekty mają, a samo wysłanie CV z pytaniem nic Cię nie kosztuje
  • Odpowiedz
@phogel: Po pierwsze, widać że to pół serio, bo raczej nie każdy DS pracuje na Macu :) No i masz, że DS musi być dobrym inżynierem, nie każdy statystyk jest inżynierem oprogramowania - także są takie rzeczy, których Data Scientist zrobi, a statystyk nie. Potwierdziłeś tylko, że to takie połączenie.

I tak, teraz często się oczekuje, żeby DS znał uczenie maszynowe. Na Odrach raczej nie robili obliczeń dla 1 TB
  • Odpowiedz
@phogel: Według mnie trochę się czepiasz, bez urazy oczywiście. Data Scientist obecnie musi połączyć inżynierię oprogramowania ze statystyką i uczeniem maszynowym (zwykle), w dodatku musi mieć dobre pojęcie o przetwarzaniu dużych zbiorów danych, co wcześniej nie było takim problemem. Skala zadań i ich złożoności się zwiększa, ja nie mam problemu z tym, że i trochę inaczej się takich ludzi nazywa.

Na pewno nie można mówić, ze znając statystykę jesteś Data
  • Odpowiedz
@czlowiek_rakieta: Big Data to w języku Silicon Valley statystyka.


@phogel: Jest jednak pewna poważna różnica pomiędzy "robieniem Big Data" (czyli pracą z Hadoop stackiem) a robieniem statystyki/data science ;)

@czlowiek_rakieta: Jest kilka firm które się tym zajmują, niestety w Polsce wciąż jest ciężko. Obecnie każdy telekom posiada całkiem niezłego i dobrze zasilonego Hadoop Stacka, jednak problem jest taki, że prawie każdy usługi bierze w OS. Po swojej
  • Odpowiedz