Wpis z mikrobloga

Może się zainteresujecie moim ostatnim side-projektem, zebrałem pół roku aktywności głównej strony (1 sty 2022 do 1 lip 2022, wojne Ukraińską widać pięknie) wykopu (najpopularniejsze znaleziska + głosowania) i zrobiłem na nich trochę analiz:

- część 1 ogólna
- część 2 o wzorze na gorące
- część 3 o botach i grupach głosujących antagonistów

Wyszły mi mniej lub bardziej ciekawe rzeczy :). Głównie patrzyłem na aktywność botów, zorganizowane grupy wykopujące/zakopujące i takie tam. Znalazłem śmieszny wzór na gorące. Zachęcam do własnych analiz, dane są dostępne publicznie tutaj).

#gruparatowaniapoziomu #datascience
  • 7
@swann: najbardziej przemawia do mnie argument, że #4konserwy z tagu #bekazlewactwa nie umieją w #heheszki w przeciwieństwie do #neuropa ( ͡° ͜ʖ ͡°)

A tak swoją drogą dziwny dobór tagów, bo większość z wybranych wydaje się zapychaczami wrzucanymi przez spamujących znaleziskami. Tak samo próby ujmowania tutaj jakichś grup w podziale politycznym przy wzięciu pod uwagę właściwie wyłącznie jednego tagu #neurpa przy pominięciu dwóch innych jak #4konserwy i
@mojemirabelki: przyjalem metodologie zbierania informacji o najbardziej popularnych tagach... nie wiem jak zdefiniowac spam ale to tez aktywnosc, ktora chcialem sprawdzic. W 40 najbardziej aktywnych tagach pojawily sie #neuropa, #bekazpisu i inne polityczne ale #4konserwy nie wpadly do tej grupy. Niezaleznie od tego, troche ciekawila mnie aktywnosc tagu #neuropa i zaobserwalaem jakies anomalie z nim zwiazane (np. ilosc niepromowanych linkow, ktore spelniaja "wzor na gorace") ale to wymaga wiecej pracy.