Aktywne Wpisy
LeKosmita +13
Uczestnicy nocnej tzw. nocniki to elita tego kraju. Podczas gdy inni ludzie śpią by jutro poświęcić się pracy zarobkowej, my dyskutujemy o filozofii, nauce i technologii. Jesteśmy współczesną arystokracją decydującą o kierunku w jakim pójdzie ten świat
GoodGuyChucky93 +13
Ja rozumiem #!$%@? nitro za to jakim człowiekiem jest ale serio teraz będziecie #!$%@? przez tydzień bo 100 postów dziennie bo typ miał jednego gejowskiego screena? Robicie aferę jak by przez przypadek pokazał folder na którym ma kilkaset GB gejowskiego porno.
Ludzie szanujcie się, to na pewno nie było pod jakiegoś mema czy coś w tym stylu tylko pod walenie sobie konia i zaspokajania ukrytych homoseksualnych zapędów i fantazji
#famemma
Ludzie szanujcie się, to na pewno nie było pod jakiegoś mema czy coś w tym stylu tylko pod walenie sobie konia i zaspokajania ukrytych homoseksualnych zapędów i fantazji
#famemma
Postanowiłem się trochę tego poduczyć, jako danych do "zabawy" użyłem hmm... wykopu a konkretnie wpisów z mirko :)
Cóżem sprawdził?
Sprawdziłem które linki z youtube są najczęściej wstawiane, oto lista 10 najpopularniejszych linków wraz z oszacowaną ilością wystąpień:
Shira Choir Sings New Song At Bar Mitzvah | 924
Sandu Ciorba - Dalibomba | 827
The Coconut Song | 742
Wham! - Last Christmas | 576
Kavinsky - Nightcall | 516
Toto - Africa | 441
The Sound of Silence | 311
REMOVE KEBAB | 283
Rick Astley - Never Gonna Give You Up | 246
Stachursky - Dosko. | 217
Jest to głównie #muzyka co jest dosyć ciekawe bo nie ograniczałem skryptu pod tym względem.
Czym sprawdzałem?
Do wyliczeń użyłem skryptu napisanego w Pythonie oraz modułu Pandas.
Oczywiście wpierw musiałem pobrać próbkę danych do pliku csv co trwało w ciul długo... (jakieś kilka miesięcy)
Czy pojawią się jeszcze jakieś ciekawe statystyki dotyczące mirko?
To zależy od was, jeżeli chcecie abym od czasu do czasu coś wstawił to podsyłajcie pomysły. Może uda mi się wyliczyć coś ciekawego :)
Na koniec każdemu kto jest zainteresowany statystyką polecam blog http://prokulski.net/
BONUS
No i #!$%@?, no i cześć | 246
#ciekawostki #statystyka #python #programowanie #bigdata
Komentarz usunięty przez autora
@Wurmloch: No właśnie liczyłem, że Testoviron będzie na pierwszym miejscu...
Może kolejne dane będą bardziej rozbudowane :D
Dalej parsujesz htmla żeby wyciągnąć interesujące Cię dane, zapisujesz je do pliku albo bazy danych i to wszystko :D To naprawdę
Oczywiście zarówno metoda iteracyjna jak i losowa są dobre. Jedno jest pewnie jak się je puści na wystarczająco długi czas to się zbierze wszystkie wpisy :D A wtedy to