@Cooltec: matma w takich tematach sprawdza się do zrozumienia modelu/problemu. W sumie możesz korzystać z modeli bez wiedzy matematycznej jednak będzie to trudniejsze przy ewentualnych problemach.

  • Odpowiedz
@Cooltec: Jako poczatkujacy data scientist na matematyce bedziesz spedzal max kilka % swojego czasu, najwazniejsza umiejetnoscia zjadajaca Ci spokojnie 80%~ bedzie analiza danych, czyli:
-wizualizacja
-czyszczenie danych
-szukanie korelacji
-wizualizacja rezultatow
  • Odpowiedz
#programowanie #bigdata #lotnictwo
mam pustkę w głowie co wpisać w googla a potrzebował bym bazę danych zwracającą starty i londowania samolotów pasażerskich ze wszystkich stolic na świecie z ostatnich 100-200 dni.

Docelowo chcę odpowiedzieć na pytanie. Czy da się wysrać w każdym kraju na świecie w mniej niż 80dni, i fajnie było by znać marszrutę co robi to.
  • 7
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

Myślałem o tym, aby zacząć uczyć się powoli #bigdata. Aktualnie pracuję w Javie, a temat big daty chciałbym rozwijać póki co z czystej ciekawości, a kiedyś może się na to przerzucić.

Od czego warto zacząć? Jakieś książki, blogi, cokolwiek? Jak w ogóle uczyć się big daty w praktyce? Ściągać jakąś przykładową bazę z neta (chyba IBM ma dosyć spore bazy przykładowe) i na nich operować? Poratujcie, bo kompletnie nie
  • 17
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@teez zacznij od hadoop definitive guide, olej rozdzial map reduce.
Później stwierdz co Chcesz robić. Real time czy batch / analiza.
Jak real-time to tyraj Kafka, flink, spark streaming
Jak batch /ml to spark, spark, spark, hive/impala, h2o. To się teraz robi. Pig osraj bo to gowno.
Poza tym scala I pajton
15k w big data to zarabiają frajerzy ( ͡º ͜ʖ͡º)
  • Odpowiedz
Hej Mireczki, mam do Was pytanie. Czy jest ktoś w grupie na co dzień mający styczność z Big Data w praktyce lub na studiach? Przymierzam się do podejścia do tego tematu i miałbym kilka pytań. #bigdata #programowanie
  • 8
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

#programowanie #bigdata

Mirki muszę jakoś przekonwertować dane.
Mam plik(csv) który zawiera dane numeryczne i symboliczne, przetworzyć mogę tylko dane numeryczne(libsvm).
Jak się do tego zabrać? Wystarczy kazdej wartości symbolicznej nadać jakiś indeks? Czy bawić się z HashingTF, Word2Vec?
  • 1
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

Dlatego bigdata to mit, nazywanie tego co już było inaczej, te same metody tylko na wiele komputerów - skorzystają z tego tylko najwięksi.
Masz zwykłe wczytywanie pliku, a nie bigdata. Czekają cie standardowe problemy jak z plikami csv: kodowanie, braki kolumn, separator występujący w tekście.
  • Odpowiedz
Mirki, przede mną trudne zadanie. Może po prostu czasochłonne?

Z racji mojej obecnej pracy powinienem liznąć przynajmniej podstaw #vba, #cpp , #C, i może #pascal.
Jednak zaczęły mnie ostatnio jarać strasznie #siecineuronowe, #machinelearning, i wszystko co związane z #datascience i #bigdata, w związku z tym pewnie powinienem ruszyć również coś w stronę #python
  • 11
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@Cooltec: Zaczynając od końca, na start Ubuntu. Łatwo się przesiąść z Windowsa, ma dobre wsparcie i jest mało wymagający na początek. Co do języków, to ja bym zaczął od jednego, a dopiero po dobrym opanowaniu go, zaczynał kolejne. I naukę najlepiej zacząć od pisania, a nie czytania milionów tutoriali bez praktyki.
  • Odpowiedz
@Cooltec: A kim chcesz zostać? Jak programistą to C# albo Java, od biedy jeszcze C++ ale to wąskie specjalizacje.

Zaczynanie od języków skryptowych ma ten problem że będziesz przenosił z nich złe wzorce których tam jest cała masa.
  • Odpowiedz
Próbował ktoś skutecznie pobierać zawartość postów i komentarzy z zamkniętych Facebookowych grup?
Graph API działa tylko dla otwartych. Próbowałem korzystać z Octoparse i różnie konfigurować, ale wyników brak/same duplikaty albo wyrzuca mi się straszny b----l, który w sumie nadal nie jest tym co trzeba.
#bigdata #datascience #parser #programowanie #facebook
  • 1
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@harris108 studiować nie studiowałem. Ale trochę siedzę w bigdata i chyba jest to jeden z najbardziej przyszłościowych i dobrze opłacanych kierunków. W Warszawie jako junior możesz liczyć na 5 netto podstawy na spokojnie.
  • Odpowiedz