Jak jednym prostym trikiem zwiększyć czytelność wykresu, gdy na mamy do zaprezentowania dane o skrajnie różnych wielkościach? Pomocą może służyć skala logarytmiczna.

W poniższym przykładzie skrzyżowano dwie zmienne dla różnych języków #programowanie - udział danego języka w liczbie wyszukiwań oraz wzrost/spadek zapytań rok do roku. Ponieważ różnice w udziałach są ogromne - porównajmy choćby 10% Javy do 0,03% F# - pokazanie ich na skali liniowej spowodowałoby duże zagęszczenie wartości na osi X
w.....a - Jak jednym prostym trikiem zwiększyć czytelność wykresu, gdy na mamy do zap...

źródło: comment_m8ybk1uN1A9hlDMDhr5hJaW97XhD1qu0.jpg

Pobierz
Barwna #grafika ukazująca znaczenia kolorów w różnych kulturach.
Skrzyżowano 84 wartości/idee/zjawiska z 10 obszarami cywilizacyjnymi. Widzicie pewnie sporo białych (no dobrze, bezbarwnych!) plam, ale pomysł jest ciekawy. Tradycyjnie dla lepszej rozdzielczości otwieramy w nowym oknie :)

Chętni mogą wypełnić ankietę https://www.colorcom.com/global-color-survey - z niej między innymi pochodzą dane.

#ciekawostki #wizualizacjadanych

#whatadata – analiza i wizualizacja danych, statystyka, ciekawostki z półświatka Data Science ( ͡° ͜ʖ ͡°)
w.....a - Barwna #grafika ukazująca znaczenia kolorów w różnych kulturach. 
Skrzyżow...

źródło: comment_dQXcyHEBKGfQ05ongBVHIh8vSfoT7Q4H.jpg

Pobierz
O ile samo BMI nie jest moim ulubionym wskaźnikiem, to zmiany w USA w ciągu 30 lat wyglądają zatrważająco. Dystrybucja w populacji cały czas względnie przypomina rozkład normalny, ale całość stopniowo przesuwa się i zwłaszcza wśród mężczyzn normą staje się "overweight".

Źródłem są dane z badań CDC, czyli Centers for Disease Control and Prevention - można samemu pogrzebać w wynikach https://www.cdc.gov/brfss/annual_data/annual_data.htm

#statystyka #zdrowie #gif #ciekawostki

PS. Szukam danych dla Polski, by zrobić
w.....a - O ile samo BMI nie jest moim ulubionym wskaźnikiem, to zmiany w USA w ciągu...

źródło: comment_GkxoJ19lwClIxCtiOU77mSYbAdgUNzHF.gif

Pobierz
A gdyby tak badanie miejsca zbrodni zacząć od... kurzu?
Okazuje się, że bakterie w nim zawarte i ich proporcje mogą powiedzieć całkiem sporo o składzie osób przebywających w danym pomieszczeniu. Kobiety, mężczyźni, psy, koty - kogo więcej, kogo mniej?

Otwieramy w nowej karcie i sprawdzamy jakich dodatkowych lokatorów mamy w domu :)

#biologia #datascience #ciekawostki a przy okazji kolejna przyjemna #wizualizacja danych

Źródło - Scientific American

#whatadata – analiza i wizualizacja danych,
w.....a - A gdyby tak badanie miejsca zbrodni zacząć od... kurzu?
Okazuje się, że ba...

źródło: comment_PyDtDWt5QfkWYkp086x790hKiMrWmelp.jpg

Pobierz
Arcyciekawa sytuacja, myślę że zakrawająca na manipulację (pewnie się nie dowiemy):

1. PiS chwali się zmianą ubóstwa skrajnego dzieci z 11,9% do 0,7% - czyli spadek o 11,2 punktów procentowych, czyli spadek o 94%.
2. PO (ustami prof. Rzońcy) podaje inne dane, akurat pod ręką jest 6%, które razem z 94% daje asumpt do twitterowych ataków.
3. ???
4. #gownoburza na temat obliczeń - https://www.wykop.pl/wpis/24910267/glowny-ekonomista-po-prof-andrzej-rzonca-liczy-pro/

Sami oceńcie, moim zdaniem to interesujący przyczynek
w.....a - Arcyciekawa sytuacja, myślę że zakrawająca na manipulację (pewnie się nie d...

źródło: comment_s9p6ZDM5z6XNZcrZPMdqWVUYOAQuDQm6.jpg

Pobierz
Sami oceńcie, moim zdaniem to interesujący przyczynek do dyskusji o manipulacjach danymi - o tym temacie na pewno warto zrobić osobny wpis :)


@whatadata: To jest interesujący przyczynek do dyskusji o powszechnej w społeczeństwie ignorancji i braku podstawowych umiejętności matematycznych. Dr hab. Rzońca się skompromitował danymi, ale użytkownicy Twittera i Wykopu się skompromitowali ignorancją matematyczną.
Potęga wizualizacji danych na przykładzie (darmowego!) oprogramowania Circos. Otwieramy w nowej karcie!

Nie będę się mądrzył na temat genomu, niech ktoś z #biologia #chemia się wypowie odnośnie przydatności takich rzeczy. Natomiast ilość upakowanych danych, relacji i powiązań jest moim zdaniem powalająca, a możliwe zastosowania szerokie.

Źródło - http://circos.ca/

#grafika #datascience #analizadanych #statystyka no i #sztuka bo jednak jest to piękne.

#whatadata – analiza i wizualizacja danych, statystyka, ciekawostki z półświatka Data Science
w.....a - Potęga wizualizacji danych na przykładzie (darmowego!) oprogramowania Circo...

źródło: comment_YEwnPN1lRdzI0VFlpYR5KUmNmeg994oa.jpg

Pobierz
Piąteczek, serwuję więc zestaw mniej lub bardziej udanych 10 żarcików z zakresu #statystyka :)
Statystycy sami o sobie!

Deviation is normal.
We feel complete and sufficient.
We are "mean" lovers.
Statisticians do it discretely and continuously.
We are right 95% of the time.
We can legally comment on someone's posterior distribution.
We may not be normal but we are transformable.
We never have to say we are certain.
We are significantly different.
Zastanawiałem się jak duży udział w wydłużeniu przeciętnego trwania życia miało zmniejszenie się śmiertelności niemowląt. Nie dotarłem jeszcze do szczegółowych liczb, ale pewną odpowiedź daje załączony wykres:
- dane z UK, powiedzmy że patrzymy na okres od 1845 roku
- poszczególne linie to oczekiwana długość życia dla osób w określonym wieku
- zmiana dla 70 latków to +5 lat życia dłużej (z 81 do 86 lat)
- zmiana dla noworodków to +41
w.....a - Zastanawiałem się jak duży udział w wydłużeniu przeciętnego trwania życia m...

źródło: comment_8wV3EJWFq3ojbY4WEWLuWzfclCTI63EE.jpg

Pobierz
@wojteklbn: Nie. Przeciętna długość życia znacznie wydłużyła się w ciągu ostatnich 50 lat.
Spodziewana długość życia dla 20-latka, wydłużyła się o ok. 10 lat.
Biorąc to pod uwagę i uwzględniając dodatkowo zmianę struktury wiekowej społeczeństwa oznacza to tylko, że nasz system emerytalny jest w głębokiej dupie.

Ale pisowni nie przeszkadzało to w obniżce wieku emerytalnego. Debile.

Tutaj fajna animacja.
http://stat.gov.pl/obszary-tematyczne/ludnosc/ludnosc/ludnosc-piramida/
Od kilku lat obserwuję w branży (nazwijmy ją umownie "analizą danych") trend rozwijania się interfejsów graficznych w programach analitycznych. Zaczynają wyglądać naprawdę przyjemnie, pracuje się w nich płynnie, w zasadzie bez konieczności pisania kodu. Ostatnio wpadł mi w ręce Alteryx, jedna z nowszych platform #datacience #bigdata
Wrażenia pozytywne, graficznie jest wręcz pięknie i wygodnie. Jest integracja z R, ale brakuje Pythona. Do zautomatyzowania procesów czyszczenia, przetwarzania i raportowania danych wydaje się być
w.....a - Od kilku lat obserwuję w branży (nazwijmy ją umownie "analizą danych") tren...

źródło: comment_qnPojIXSA6U29dfFmM2DR3Uz8S42YcWs.jpg

Pobierz
Cóż czytasz, mości książę?

Słowa, słowa, słowa.


Jaki jest Waszym zdaniem najbardziej znany cytat z Szekspira? "Być albo nie być?"
A najczęściej używana fraza, być może bez świadomości autorstwa? Zapoznałem się ostatnio z grafiką twierdzącą, że pan William wymyślił słowa tak powszechnie używane jak "operate", "manager", "investments". Mocno mnie to zdziwiło, ale o tym za chwilę.

Obrazek jest pomysłowy, mamy 4 ścieżki dla różnych gatunków uprawianych przez Szekspira,
w.....a - > Cóż czytasz, mości książę?
 Słowa, słowa, słowa.

Jaki jest Waszym zdan...

źródło: comment_EPo4rqplGT1HQWudUqYMzyE32NlrZv62.jpg

Pobierz
Dziś wtręt z zakresu #malarstwo i #sztuka - jak połączyć to z #datascience ?

Bardzo proszę, oto kolory wybierane przez wielkich mistrzów na przestrzeni tysiąca lat. Na osi X oczywiście czas, na osi Y "Hue Value" (nasycenie? odcień?) + wielkość koła jako proporcja użytej barwy. Pewnie fachowcy z #grafika mogą powiedzieć coś więcej, ja kojarzę tylko hasło HSV jako bazę kolorów.

Przerost formy nad treścią, to tylko #ciekawostki ? Nie do końca,
w.....a - Dziś wtręt z zakresu #malarstwo i #sztuka - jak połączyć to z #datascience ...

źródło: comment_CpBPlQPHKrjsqjAkltq72NXzrEQKuCIW.jpg

Pobierz
Zastanawiałem się ostatnio jak w prosty sposób wrzucić na wykresy coś co może zaciekawić tag #montypython - oto i rezultat :)

Długość życia wszystkich uczestników słynnego meczu filozofów, nałożona na oś czasu. Niebiescy oczywiście Grecy, Niemcy na czerwono, a sędziowie to zwykłe zielonki.

#filozofia #mecz #tworczoscwlasna #wizualizacja #historia humoru


Wystarczył #excel i wykres skumulowany słupkowy, otwieramy tradycyjnie w nowym oknie.

#whatadata – analiza i wizualizacja danych, statystyka, ciekawostki z półświatka Data Science
w.....a - Zastanawiałem się ostatnio jak w prosty sposób wrzucić na wykresy coś co mo...

źródło: comment_owQyk1UbymgpSY4JXbhtjlgwEBiBJ338.jpg

Pobierz
Pomysłowa #grafika wiążąca kilka aspektów #sportywalki #sztukiwalki
- na osi X mamy rozpięty wymiar Zachód - Wschód, jako miejsce pochodzenia danej aktywności
- oś Y pokazuje natężenie sposobu walki, czyli wymiar uderzane/chwytane

Do kilku spraw można się pewnie przyczepić, jak choćby centralne położenie #bjj

Mam niedosyt, bo właściwie wcale nie został wykorzystany wymiar czasu - obok siebie mamy antyczny #boks i ponad 2000 lat młodsze savate. Spróbuję to kiedyś poprawić :)

#
w.....a - Pomysłowa #grafika wiążąca kilka aspektów #sportywalki #sztukiwalki 
- na ...

źródło: comment_gQSHYuB4313sJGEEvcX8TkdEYi2q9UFL.jpg

Pobierz
Czy Tobie także marzy się praca w #datascience ? Proszę bardzo, po tym obrazku na pewno nabierzesz śmiałości!

Z samego Toolboxa znam 4/14 narzędzi, regularnie używam tylko dwóch. Na szczęście działa się w zespole :)
#nauka #machinelearning #naukaprogramowania #statystyka #wizualizacja #grafika

#whatadata – analiza i wizualizacja danych, statystyka, ciekawostki z półświatka Data Science ( ͡° ͜ʖ ͡°)
w.....a - Czy Tobie także marzy się praca w #datascience ? Proszę bardzo, po tym obra...

źródło: comment_vOsTvbJPvlEEIec0Beg4PhmixkCrUwbE.jpg

Pobierz
W dzisiejszym wpisie krótko o tym, jak wizualizacja danych ratowała życie już w połowie XIX wieku.

Tl;dr Jak wykryć źródło zarazy, gdy teorie dotyczące jej rozprzestrzeniania są fałszywe?

W 1954 roku w Londynie na cholerę zmarło ponad 600 osób. W tamtym czasach równie powszechnie co błędnie uważano, że za epidemię odpowiada „morowe powietrze”. John Snow, lekarz i jeden z twórców epidemiologii, drążył kwestię przyczyn rozprzestrzeniania się cholery, bo według niego fakty w
w.....a - W dzisiejszym wpisie krótko o tym, jak wizualizacja danych ratowała życie j...

źródło: comment_5xKQ1EeSh3Ntrl8iNj9eyzJPn1n0vicN.jpg

Pobierz
Kolejna ciekawa #wizualizacja związana z historią. Tym razem śmierć wojskowych i cywilów w wyniku wojen, konfliktów i czystek.

Niektóre wymiary są dość oczywiste - czas na osi X czy wielkość koła oddającą bezwzględną liczbę ofiar. Ale zwróćcie uwagę na oś Y - czyli liczbę śmierci na 100 tysięcy ludzi. Im wyżej znajduje się dany konflikt, tym większy % ówczesnej populacji pochłonął. Wysoko mamy oczywiście obie wojny światowe, ale ładnie widać też jak
w.....a - Kolejna ciekawa #wizualizacja związana z historią. Tym razem śmierć wojskow...

źródło: comment_UZEY7zMxtnKx4vt7BeUsdAmDLA6kPLhc.jpg

Pobierz
Jakbyś porównał do populacji ziemi to byś zobaczyl że jest o wiele bardziej cywilizacji sensu obecnie.

A z innej beczki to w Brazylii ginie rocznie na ulicach 27000 ludzi, więcej niż w Syrii.

Per capita to nic vs Kolumbia.
Takie użycie #datascience mnie urzeka - https://bost.ocks.org/mike/miserables/

Trzy rodzaje grupowania postaci:
- alfabetycznie
- po częstotliwości występowania w książce
- segmentami współwystępujących postaci

#statystyka #wizualizacja #ciekawostki #javascript #d3js #literatura #ksiazki bo "Nędznicy" :)

#whatadata – analiza i wizualizacja danych, statystyka, ciekawostki z półświatka Data Science ( ͡° ͜ʖ ͡°)
Dzisiaj na odstresowanie gra, ale w klimacie tagu #whatadata :)

http://guessthecorrelation.com/ #nauka i #rozrywka w jednym!

Zgadujemy współczynnik korelacji, w zależności od naszej domyślności jesteśmy nagradzani serduszkami i monetami, a w razie słabszego strzału tracimy "życia".

Projekt autorstwa studenta Cambridge ma służyć nie tylko zabawie, ale także zbieraniu danych na temat powiązań między postrzeganiem wykresu korelacji a jej faktycznym współczynnikiem. Przyznam że to bardzo pomysłowe :)

#gry #statystyka #wizualizacja

#whatadata – analiza