Wykop.pl Wykop.pl
  • Główna
  • Wykopalisko130
  • Hity
  • Mikroblog
  • Zaloguj się
  • Zarejestruj się
Zaloguj się

Popularne tagi

  • #ciekawostki
  • #informacje
  • #technologia
  • #polska
  • #swiat
  • #motoryzacja
  • #podroze
  • #heheszki
  • #sport

Wykop

  • Ranking
  • Osiągnięcia
  • FAQ
  • O nas
  • Kontakt
  • Reklama
  • Regulamin

539

MirkoAnalytics - projekt, w którym nieświadomie mogłeś brać udział

Pokaż treści 18+

MirkoAnalytics - projekt, w którym nieświadomie mogłeś brać udział

Artykuł przedstawia analizę aktywności mirków lubiących moje poprzednie posty. Sprawdź czy wielki brat nie śledził i Ciebie! ( ͡° ͜ʖ ͡°)ノ⌐■-■

Bogdan191
Bogdan191
z
wykop.pl
dodany: 27.11.2017, 15:36:05
  • #
    ciekawostki
  • #
    nauka
  • #
    bogdansymulant
  • #
    wykop
  • #
    gruparatowaniapoziomu
  • #
    zainteresowania
  • 54
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

Dzisiejszy wpis będzie długi, więc dodaję go jako artykuł na wykopalisko. Jak zauważył @Fizyk_kwantowy, nie dotrzymałem słowa i nie wrzucałem niczego od ponad miesiąca. W tym czasie przeprowadzałem pewien eksperyment socjologiczny na Wykopie, w którym część z was nieświadomie brała udział (⌐ ͡■ ͜ʖ ͡■) Ci, którzy śledzą tag #bogdansymulant mogą czuć się zdezorientowani, bo do tej pory wszystko co wrzucałem było związane z analizami i symulacjami komputerowymi. Dla tej części społeczności załączam krótkie wyjaśnienie w spojlerze pod koniec artykułu.

Podczas wrzucania poprzedniego postu z wystąpieniem TEDx, na wykopie pojawił się artykuł o chorobie trapiącej żeglarzy Kolumba. Kilka godzin później artykuł zniknął i pojawił się ponownie z mniejszą ilością plusów... po następnej godzinie artykuł był już w gorących (ง ͠° ͟ل͜ ͡°)ง Pomyślałem, że to sprytne zagranie, chociaż czułbym się dziwnie wrzucając coś kilka razy. Nie potępiam, bo każdy chce dotrzeć do największej liczby osób, z drugiej strony dany wpis może po prostu być nieciekawy. Tak czy siak autor tamtego artykułu dał mi zajęcie na najbliższy miesiąc - znaleźć złotą godzinę mirkowania!

W Pythonie napisałem skrypt, który sprawdza aktywność użytkowników, którzy poprzednio lubili moje wpisy (ok. 650 użytkowników). Aktywność ta była mierzona na dwa sposoby. Pierwszy to sprawdzenie czy przy nicku użytkownika występuje zielona kropka. Drugi to sprawdzenie historii aktywności użytkownika (kiedy dodał wpis, kiedy go skomentował, kiedy coś wykopał itd.). Na tej zasadzie otrzymałem wykresy przedstawione poniżej.



Link do pełnego obrazu



Link do pełnego obrazu

Mając dane z całego miesiąca zostało tylko zestawić wartości dzienne ze sobą. Po odfiltrowaniu wartości skrajnych, stworzyłem wykres przedstawiający średnią ilość użytkowników w ciągu dnia (zacieniowany obszar przedstawia średnią +/- 2*odchylenie standardowe). W oparciu o wykres łatwo zauważyć, że najwięcej użytkowników lubiących mój tag przesiaduje na mirko pomiędzy 20:30 a 21:30.



Link do pełnego obrazu

Pytanie czy to na pewno najlepsza pora na wrzucenie postu? Raczej nie, ponieważ chwilę później liczba użytkowników gwałtownie maleje (powszechnie wiadomo też, że nocna nie przyczynia się do rozwijania tagów typu #gruparatowaniapoziomu (✌ ゚ ∀ ゚)☞ ). Wygląda na to, że odpowiednim momentem na wrzucenie czegoś wartościowego jest południe, a jeszcze lepszym godzina 16:30. Wtedy populacja rośnie i jest potencjalnie wysoka szansa na dotarcie do największej liczby osób. Dziś moja hipoteza zostanie poddana próbie (ʘ‿ʘ)

Po uzyskaniu pierwszych wyników, zdecydowałem się, że pójdę o krok dalej i sprawdzę co lubią wykopki lubiące mój tag. Jak? w ten sam sposób w jaki robią to współczesne media społecznościowe... sprawdzę które tagi dany użytkownik wykopuje lub jakich tagów używa tworząc wpisy na wykopalisko i na mikroblog. Top 15 tagów, których użytkownicy lubią mój tag wygląda następująco:

- #ciekawostki - 645 Mirków
- #heheszki - 643 Mirków
- #polska - 635 Mirków
- #humorobrazkowy - 628 Mirków
- #motoryzacja - 600 Mirków
- #polityka - 593 Mirków
- #nauka - 589 Mirków
- #wykop - 589 Mirków
- #rozowepaski - 586 Mirków
- #technologia - 578 Mirków
- #swiat - 561 Mirków
- #gry - 561 Mirków
- #humor - 560 Mirków
- #rozrywka - 560 Mirków
- #pracbaza - 558 Mirków


Nie mogłem także pozostać dłużny wobec całej społeczności wykopu i stworzyłem taką oto chmurę tagów:



Link do pełnego obrazu

Podobną grafikę można stworzyć dla poszczególnych użytkowników. Przykładowo, zestawienie dla takiego jednego mirka z mojej bazy danych, wygląda następująco:



Link do pełnego obrazu

Podsumowując wpis - odnoszę wrażenie, że Wykop to nie tylko ciekawa społeczność, ale też kopalnia wiedzy na temat polskich internautów. W cale nie dziwi mnie, że dużo firm się tu reklamuje, politycy mieli tu swoje AMA, a niektóre gazety traktują ten portal jako źródło informacji.
Programując okazjonalnie od dwóch lat potrafię wygenerować listę osób obstawiających bardziej przy 4konserwy niż neuropa. Biorąc pod uwagę umiejętności ludzi utrzymujący się z programowania, przestaje mnie dziwić sytuacja, w której bagiety zgarniają gościa za zdjęcie z rurką w silniku samolotowym. Oczywiście sytuacja z rurką nie powinna mieć miejsca, pytanie tylko czy mirki spod wykopjointclub powinny się czegoś obawiać?

Kończąc wpis ogłaszam #glupiewykopowezabawy ! Pierwszych 100 użytkowników, którzy polubią ten post otrzyma swoją własną chmurę tagów we wpisie, który dodam na mirko w tym tygodniu (w przypadku innych preferencji odnośnie kształtu piszcie na priv).

Krótkie wytłumaczenie dla ludzi, którzy śledzą mój tag i oczekiwali wszystkich kolorów tęczy.

pokaż spoiler Każda analiza musi zostać zwieńczona dokładnym sprawdzeniem wyników, porównaniem do wyników rzeczywistych itp. Z drugiej strony, co raz częściej słyszy się o tym, że Data Scientist (ponoć analityk danych to nie to samo ...) to zawód przyszłości. Zakładając, że projekt, który przedstawiłem wpisuje się w konwencje tego terminu, chciałem sprawdzić jak bardzo zawód Inżyniera MES różni się od zawodu wspomnianego wcześniej.
W przypadku pracy nad modelami numerycznymi, często zachodzi potrzeba zapisu danych do pliku zewnętrznego i ich dalszej obróbki poza programem gdzie powstały. Ja w tym celu często używam Python'a, ponieważ Abaqus, w którym pracuje ma API do tego języka i łatwo można operować na dużej ilości danych. Analogiczna sytuacja miała miejsce w powyższym projekcie - odpowiednie dane zostały ściągnięte ze strony internetowej, zapisane w użytecznym formacie i przetworzone tak aby otrzymać kolorowe wykresy. Nie chcę wyciągać pochopnych wniosków, ale odnoszę wrażenie, że profesje te są bardzo podobne.
Kolejny wpis będzie już normalny, więc oczekujcie!

Komentarze (54)

najlepsze

benyowsky
benyowsky
27.11.2017, 20:16:42
  • 3
@Bogdan191 jako, że z wykształcenia jestem analitykiem danych to wykopuję i prosiłbym o jakieś wskazówki odnośnie Pythona. Do tej pory dane statystyczne wrzucałem do SPSS-a, ostatnio żona namówiła mnie na cały pakiet R i tam sporo "korelowałem". Może wrzuciłbyś jakiś kod źródłowy Pythona odnośnie swojego projektu, bo chciałbym poznać jego możliwości i czy jest lepszy od R...

Pozdrawiam.
  • 6
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych odpowiedziach

Bogdan191
Bogdan191
Autor
27.11.2017, 20:50:00
  • 10
@benyowsky: jak tylko uporządkuje kod to wrzuca na swojego Githuba i podeśle link.

Ciężko mi porównać Pythona do R bo nie pracowałem nigdy w R. W oparciu o to co czytałem, wydaje mi się, że daje więcej możliwości, bo głównym zastosowanie R była analiza danych, a Pythona pisanie skryptów ogólnego zastosowania. Ja na codzień pracuje w Abaqusie, który ma API do Pythona i wybór języka był podyktowany tym, że już
  • Odpowiedz
xstempolx
xstempolx
28.11.2017, 08:31:05
  • 4
@benyowsky: o hui, już myślałem że ja ten post napisałem.

  • Odpowiedz
WuDwaKa
WuDwaKa
27.11.2017, 23:00:12
  • 2
@Bogdan191: Ciekawa chmura tagów o pewnym użytkowniku ( ͡° ͜ʖ ͡°)
  • 1
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych odpowiedziach

Bogdan191
Bogdan191
Autor
28.11.2017, 08:50:20
  • 1
@WuDwaKa: (⌐ ͡■ ͜ʖ ͡■)
  • Odpowiedz
A.....T
A.....T
konto usunięte 27.11.2017, 22:13:55
  • 2
Treść przeznaczona dla osób powyżej 18 roku życia...
  • 1
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych odpowiedziach

Bogdan191
Bogdan191
Autor
28.11.2017, 10:15:32
  • 3
@Ap2OAxExHamg8qlzUgsfcReovkvSdSvnTMT: Dokładnie tak. Komputer, którego używałem do ściągania danych nie był wyłączony przez ponad miesiąc... całe szczęście nie ja płacę rachunki za prąd (✌ ゚ ∀ ゚)☞
  • Odpowiedz
klikus
klikus
klikus
27.11.2017, 20:55:16
  • 2
Treść przeznaczona dla osób powyżej 18 roku życia...
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych odpowiedziach

PowerfulTransistor
PowerfulTransistor
PowerfulTransistor
27.11.2017, 22:27:14
  • 1
nie widzę tagu #srajzwykopem, zakop
  • 1
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych odpowiedziach

Bogdan191
Bogdan191
Autor
27.11.2017, 22:33:17
  • 0
Treść przeznaczona dla osób powyżej 18 roku życia...
  • Odpowiedz
SunnO
SunnO
27.11.2017, 21:46:17
  • 1
#dataporn #wykresyporn (。◕‿‿◕。)
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych odpowiedziach

Kamyczek91
Kamyczek91
27.11.2017, 16:31:49
  • 1
Czekam na moja chmure z tagami ʕ•ᴥ•ʔ
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych odpowiedziach

Wykopaliskasz
Wykopaliskasz
01.12.2017, 21:03:14
  • 0
@Bogdan191: Żeby poznać "złotą godzinę" dodawania znalezisk, lepiej było przeanalizować godziny dodania kilkuset wykopanych już znalezisk. Powyższa analiza pokazała aktywność użytkowników w ciągu doby. Nie odwzorowuje to do końca chęci wykopywania zależnej od różnych czynników. Ja na przykład zauważyłem, że znaleziska (i wpisy na mirko), które zawierają dużo tekstu, lepiej się plusują, gdy są dodane wcześnie rano. Materiały filmowe lepiej dodawać późnym popołudniem. Ale to tylko moja obserwacje na małą
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych odpowiedziach

Enzo_Molinari
Enzo_Molinari
28.11.2017, 09:26:46
  • 0
czy to jest to tzw. big data w wydaniu lokalnym?
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych odpowiedziach

kamdz
kamdz
28.11.2017, 09:15:25
  • 0
@Bogdan191 czym generowałeś chmury tagów?
  • 1
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych odpowiedziach

Bogdan191
Bogdan191
Autor
28.11.2017, 09:18:18
  • 1
@kamdz: tej biblioteki użyłem http://amueller.github.io/word_cloud/
  • Odpowiedz
  • <
  • 1
  • 2
  • 3
  • Strona 2 z 3
  • >

Hity

tygodnia

Ludzie masowo kupowali/sprzedawali spółki spełniające kryteria dofinansowań KPO
Ludzie masowo kupowali/sprzedawali spółki spełniające kryteria dofinansowań KPO
3972
Szpital nie dostał środków z KPO na onkologię.
Szpital nie dostał środków z KPO na onkologię.
3730
582 tys. na zwalczanie uprzedzeń jurorów w konkursach muzyki klasycznej xD
582 tys. na zwalczanie uprzedzeń jurorów w konkursach muzyki klasycznej xD
2967
KPO to nic! Urzędnik z miasta powiatowego kupuje pełnomorski jacht za 12 MLN.
KPO to nic! Urzędnik z miasta powiatowego kupuje pełnomorski jacht za 12 MLN.
2579
Akt oskarżenia przeciwko Sebastianowi M.
Akt oskarżenia przeciwko Sebastianowi M.
2187
Pokaż więcej

Powiązane tagi

  • #zainteresowania
  • #historia
  • #ciekawostkihistoryczne
  • #technologia
  • #nauka
  • #polska
  • #gruparatowaniapoziomu
  • #heheszki
  • #wydarzenia
  • #swiat
  • #mikroreklama
  • #informacje
  • #rozrywka
  • #antycznyrzym
  • #motoryzacja

Wykop © 2005-2025

  • O nas
  • Reklama
  • FAQ
  • Kontakt
  • Regulamin
  • Polityka prywatności i cookies
  • Hity
  • Ranking
  • Osiągnięcia
  • Changelog
  • więcej

RSS

  • Wykopane
  • Wykopalisko
  • Komentowane
  • Ustawienia prywatności

Regulamin

Reklama

Kontakt

O nas

FAQ

Osiągnięcia

Ranking