Wpis z mikrobloga

scrapowanie przeszlo pomyslnie, 2793 strony głównej z wykopaliskami, komentarzami, odpowiedziami do komentarzy + hashtagi, zawołania, nawet kolor nicka udało się wyciągnąć - łącznie jakieś 3,5gb danych do analizy ( ͡° ͜ʖ ͡°)

teraz pora na oczyszczenie danych i text mining komentarzy na wykopie ( ͡° ͜ʖ ͡°)

#dataisbeautiful #machinelearning #statystyka #python #apachespark #bigdata
kodi1911 - scrapowanie przeszlo pomyslnie, 2793 strony głównej z wykopaliskami, komen...

źródło: comment_iHqByudjm3hG5YvdN42R9ngcjVtdGy12.jpg

Pobierz
  • 28
@information_retriever: spytałeś jak wziął dane (ja rozumiem jako „jaką techniką”), a nie jakiego narzędzia użył ( ͡° ͜ʖ ͡°)

@Kajakiem_przez_Tybet: myślę, że z limitem nie byłoby problemu jakby się z @m__b dogadał ;)
No ale drugi argument oczywiście sensowny; a i ja nie siedzę z API wykopowym. No ale niby aplikacje na Androida o niego są oparte, więc chyba wystarczająco dużo dostarcza…