Wpis z mikrobloga

@am_anfang_war_napoleon: Sorry za zwłokę, ale mocno się zastanawiałem czy w ogóle Ci odpowiadać i angażować się w taką dziecinną przepychankę.

Ogólnie trochę nwm jak się zabrać za odniesienie do Twoich argumentów, bo generalnie z mojej perspektywy zrobiłeś wpis, w którym hejcisz człowieka, który się skarży na chamskie potraktowanie przez jednego z Twoich kumpli, i Twoja główna linia argumentacji jest taka, że nie ogarnia, że może i ma rację co do wykresów liniowych, ale wykresy słupkowe MUSZĄ się zaczynać od 0 i na tym — jak rozumiem — miałby polegać błąd. Po godzinie od napisania tego tekstu najwyraźniej jednak doczytałeś swoje źródło, więc zaznaczyłeś w komentarzu, że jednak takiej zasady nie ma, i że czasem wykresy słupkowe mogą się zaczynać od zera, co funkcjonalnie powoduje, że całe Twoje narzekanie chybia celu, bo ja tam sb pozwoliłem na złośliwość jako ogólny przytyk wobec osób, które uważają że taka (albo trochę słabsza — że jest to dozwolone tylko w naprawdę wyjątkowych sytuacjach) zasada istnieje i na tym tylko opierają całą swoją argumentację — w wersji silnej (tj. że absolutnie muszą) tak twierdzi przykładowo przywołana przez Cb ekspertka, a w wersji słabszej (że mogą tylko w ekstremalnie rzadkich przypadkach) neuropek, od którego się zaczęło.

W dodatku jeden z Twoich argumentów jest albo zwyczajnym kłamstwem, albo wynikiem bardzo nieuważnego zapoznania się ze źródłem, piszesz, że:

Jeżeli wykres słupkowy nie zaczyna się do zera, jest manipulacją, co zostało nawet wskazane w filmiku z numeru 1, który wedle osoby, która skrytykowała rzep miał obalać jego twierdzenie.


We wspomnianym filmiku nie zostało nic takiego wskazane, w żadnym momencie nikt tam nie mówi, że „jeżeli wykres słupkowy nie zaczyna się od zera jest manipulacją” ani nic takiego nawet nie sugeruje; ba, w ogóle nie pada tam sformułowanie wykres słupkowy. Wizualnie natomiast wykres tego typu pojawia się tam dokładnie jeden, w dodatku taki, który jest okrojony do wskazania dwóch punktów w czasie i — jak słusznie stwierdza lektor — brak zera to najmniejszy problem tego wykresu, problemem jest opuszczenie kontekstu. Trzeba być naprawdę mocno utorowanym na wyciągnięcie założonego z góry wniosku, żeby ze sformułowania „brak zera jest najmniejszym problemem tego konkretnego wykresu” wyinterpretować ogólną zasadę „jeżeli wykres słupkowy nie zaczyna się od zera to jest manipulacją”. I jeszcze — jeżeli dobrze odczytuję intencję — kuriozalnie sugerować samozaoranie się kogoś, kto wkleił ten filmik. Co więcej Voxowi zdarzało się w okresie zbliżonym do wydania tego filmiku dopuszczać przeklejanie do swoich artykułów wykresów słupkowych nie zaczynających się od zera, co jeszcze bardziej poddaje taką interpretację w wątpliwość, ale zostawmy to.

Piszesz też, że @AutismoHarbinger obejrzał tyle wykresów i nie zorientował się, że dosłownie ŻADEN z nich nie jest wykresem [słupkowym]. W dodatku dalej w komentarzach piszesz, że to nie jest przypadek, że znalazł tylko wykresy liniowe. Jeżeli dobrze rozumiem to chcesz tym chyba zasugerować, że takie wykresy jest jakoś trudno znaleźć, i że jakby autor zastanowił się nad znalezionym materiałem to by ogarnął na czym polega różnica. Nie chce mi się robić jakiegoś szerszego poszukiwania wykresów na potrzeby tego typu, ekhem, dyskusji (xD), więc wrzucę jakieś pierwsze z brzegu publikacje z Psychological Science, które akurat były w open access. Przykładowo nie zaczynają się od zera wykresy b, c i d z [tego](
https://journals.sagepub.com/doi/full/10.1177/0956797620970548) badania, albo wykresy z tego. Ponieważ w oryginalnym wpisie, który krytykujesz było Nature i w komentarzach pojawiły się śmieszki z tego, że @AutismoHarbinger pozwolił sobie na lekką złośliwość pt. „[p]owinniście powiedzieć to głupim naukowcom z Nature”, to poświęciłem też nieco czasu na wyszukanie wykresów słupkowych tam: np. wykres c tu, albo a tu. Ogólnie nie będę się tutaj bawił w jakieś bardziej kompleksowe poszukiwania, bo dla każdego kto od czasu do czasu czyta jakieś badania jest chyba oczywiste, że takie rzeczy się zdarzają.

Co do Twojego głównego argumentu, tj. powołania się na ekspertów — w skrócie to powołałeś się na dwóch ludzi, którzy twierdzą coś niemal krańcowo odmiennego i żaden nie jest ekspertem w kwestii wpływu wykresów na manipulację ludźmi. Ogólnie wiadomo, że czasem trudno ocenić jaka ekspertyza jest relewantna, a czasem najwyraźniej nawet można pomylić konwencję z czymś na kształt konsensusu naukowego, więc częściowo rozumiem też to nieporozumienie. Piszesz, że „będę się jednak trzymał opinii statystyków, których przytoczyłem” — przytoczyłeś tylko jedną statystyczkę, liczba mnoga pewnie jest dlatego, że wydaje Ci się, że blogasek, na który się powołałeś jest też prowadzony przez statystyka, ale to nieprawda, Skelton jest po prostu dziennikarzem. Ponadto w poście, na który się powołujesz jawnie się odżegnuje od posiadania ekspertyzy w temacie tego, czy jest jakaś różnica między wykresami słupkowymi i liniowymi pod względem manipulacji (rozumianej jako efekt na percepcję):

We'd then be able to see how truncating the y-axis affects people's perception of the data and, crucially, whether the impact on people's perception is any different for line charts and bar charts. […] I'll leave it to the experts, but I think a study like this would also require some careful thought about how to measure perception.


I nawet gdyby był statystykiem, to byłoby to słuszne, bo ekspertem tutaj może być psycholog albo kognitywista (i to oczywiście nie każdy, ale to już inna sprawa); ze statystyki samej w sobie nijak nie wynika przecież to, jakie przedstawienia danych są manipulacją; dlatego zresztą druga przywołana przez Cb ekspertka jako jedyny argument przedstawia to, że jest jej zdaniem taka zasada, że wykres słupkowy nie może się nie zaczynać od zera, i że wynika to z podręczników akademickich do datavizu (nie do statystyki; a nawiasem mówiąc to ta statystyczka wyznaje tę zasadę tak radykalnie, że odrzuca nawet przypadki odcięcia 0 na wykresach słupkowych, z którymi Ty się najwyraźniej — sądząc po plusach — zgadzasz, i w których powszechnie takie są używane). I jest to w pewnym sensie prawda, bo rzeczywiście podręczniki do datavizu twierdzą, że wykresy, w których dane przedstawiane są przy użyciu wysokości powinny zawierać zero. Przykładowo Cairo w The Truthful Art: Data, Charts, and Maps for Communication w rozdziale Basic Principles of Visualization pisze tak:

I truncated their Y-axis, so the baseline in both cases is set to 40 percent, rather than to 0 percent. It isn’t acceptable to do so when the main visual cue to interpret the data is length or height measured from a common baseline. Bar charts, lollipop charts, histograms, and their variants should have a 0-baseline—unless you want to increase the chances of misunderstanding (which some people do, unfortunately!).


Coś podobnego pisze też Tufte (nie zacytuję, bo nie chce mi się przepisywać a nie mam pod ręką zdigitalizowanej wersji) i ogólnie cały jego pomysł z lie factor opiera się na pomyśle, że obcinanie jest niedopuszczalne, gdy zmienna jest „kodowana” poprzez obszar/wysokość. Ten cały pomysł nie jest jednak oparty na jakichś poważnych argumentach, na badaniach czy w ogóle na jakimś poważniejszym akademickim namyśle. Po prostu tak się przyjęło, to jest zwykła konwencja niemal całkowicie arbitralnie ustalona w środowiskach dataviz. Robienie z tego jakiegoś wielkiego argumentu za tym, że to manipulacja, i że jak ktoś nie wyznaje tej zasady jest niedouczony jest mniej więcej tak samo kuriozalne jak powoływanie się na konwencję w typografii co do tego, że nie wolno podwójnie wyróżniać akapitów przy urządzaniu nagonki na jakieś wydawnictwo, które to zrobiło w wydanej przez siebie książce. Mało poważne po prostu.

Argumenty za tą konwencją generalnie są dwa. Pierwszy taki, jak w powyższym cytacie — że w wykresach słupkowych to jest manipulacja, bo ludzie inaczej interpretują wysokość/obszar niż trendy przy wykresach liniowych, więc są bardziej podatni na oszustwo — czy tak jest to pytanie empiryczne i badanie, które jest przywołane we wpisie do bloga, na który się powołujesz dość jasno wskazuje, że cały argument jest oparty na niezrozumieniu tego, jak działa percepcja wykresów. Nie ma bowiem praktycznie żadnej różnicy pod względem wpływu na interpretację przez ludzi wykresów pomiędzy słupkowymi bez 0 i liniowymi bez 0. Obcięcie zmienia percepcję dokładnie tak samo (w dodatku niezależnie od prawidłowego odczytania wartości liczbowych):

Experts in information visualization and statistical graphics have produced conflicting advice on how harmful it is to start the y-axis of a chart from values other than 0. This conflict has often centered on the distinction between line graphs and bar charts, or on best practices for depicting axis breaks. Despite the claims that y-axis truncation is only “deceptive” for certain kinds of charts, or that explicit indication of axis breaks can ameliorate this “deception,” we find that the exaggeration introduced through truncation appears to persist across chart types and chart designs, and even when #!$%@? makeaccurate reports of the numbers they observe. [wyróżnienie moje]


i nieco wcześniej:

Our experimental results suggest that truncating the y-axis has a consistent and significant impact on the perceived importance of effect sizes. This qualitative bias occurs in both line charts and bar charts, as well as in bar charts that visually indicate either broken axes or the continuation of bars beyond the bounds of the chart. This bias is not merely a misreading of values, but seems to be connected to the visual magnification of differences.


Jeżeli więc ten argument miałby w ogóle działać, to trzeba by było przyjąć, że nie wolno tak robić także dla wykresów liniowych. Nikomu tego nie zabraniam rzecz jasna, ale ponieważ takie wykresy powszechnie występują prawie wszędzie, byłby to raczej dość niepraktyczny dogmatyzm (i nie byłoby zbyt sensowne chyba robienie z tego jakiegoś wielkiego argumentu przeciwko jakiemuś jednemu konkretnemu wykresowi). Lepszy wniosek moim zdaniem jest jednak taki, że ludzie po prostu interpretują wykresy tak samo, jak każdy inny komunikat i uznają dobrany baseline jako wybrany nieprzypadkowo i stanowiący wizualną implikaturę komunikującą to, jaki rodzaj różnic pomiędzy zmiennymi jest duży, a jaki mały. W końcu odległości między liczbami nie mają jakiegoś inherentego znaczenia, do którego ma się bezpośredni dostęp poprzez spojrzenie na wykres. W takim przypadku można się kłócić z doborem prezentacji w miarę merytorycznie po prostu wyjaśniając powód niepoprawności akcentowania tych odległości, bez potrzeby wymyślania jakiejś dogmatycznej zasady o zerze.

Dorzucę dla porządku jeszcze jeden cytat z przywołanego badania:

However, we resist the interpretation of our experimental results to mean that, as Huff suggests [16], all charts with quantitative axes should include 0. The designer of the visualization, by selecting a y-axis starting point, has control over the subjective importance of the resulting differences [39]. There is no a priori, domain-agnostic ground truth for how severe, important, or meaningful an effect size ought to be. We interpret our results as meaning that there is no obvious way for designers to relinquish the responsibility of considering effect size in their charts. We reject the unequivocal dichotomy of “honest” and “dishonest” charts


Drugi argument jest taki, że wykresy słupkowe są rzekomo tylko od tego, żeby porównywać absolutne wartości, a liniowe do pokazywania rzeczy takich, jak zmiany w czasie; i obcięcia są niedopuszczalne w tych pierwszych właśnie z tego powodu, że wysokość „koduje” absolutną wartość, a więc obcięcie ją przekłamuje. Nie jest to z naszego punktu widzenia zbyt istotny argument, bo wykres z TVP przedstawia akurat zmianę w czasie — można się oczywiście czepiać, że powinien być wykresem liniowym, ale bez jakiegoś dodatkowego argumentu nt. tego, co jest takiego specyficznego w słupkach, nie da się powiedzieć na samej tej podstawie, że problemem jest tutaj nieuwzględnienie 0.

Ponieważ to rozgraniczenie na wykresy liniowe i słupkowe jest oparte na dosyć słabych przesłankach, to można się przyjrzeć co podręczniki do datavizu mają do powiedzenia w podobnych sytuacjach o wykresach liniowych. Cairo po przywołanej już tu wzmiance i wskazaniu mało istotnego z naszego punktu widzenia wyjątku, gdzie można jego zdaniem pomijać zero w wykresie słupkowym, podaje następujące zalecenie:

We can derive a simple and flexible rule from this discussion: rather than trying to invariably include a 0-baseline in all your charts, **use logical and meaningful baselines** instead. This rule should help us decide what to do when designing charts in which length isn’t the method of encoding. I am thinking of dot plots, scatter plots, line charts, and so on, which rather rely on position over common axes. For example, if you’re talking about the historical unemployment rate in a country and this variable has never dropped below 5 percent, then 5 percent could be the baseline for your line chart. [wyróżnienie za oryginałem]


Nie wydaje mi się więc, że miałby jakiś specjalny problem z obcięciem omawianego wykresu do 4%, gdyby nie przyjmował akurat założenia o jakiejś fundamentalnej różnicy pomiędzy słupkowymi i liniowymi wykresami. Wszystko jest więc tu oparte od początku do końca na konwencjonalnej regule, za którą nie stoją żadne zobowiązujące argumenty.

I autor bloga, na którego się powołujesz wyraźnie — w przeciwieństwie do statystyczki, którą też przywołujesz — przyznaje, że trudno mu określić czy to jest coś więcej niż konwencjonalna wiedza. Linkuje też w tym wpisie do drugiego wpisu, w którym pisze mniej więcej to samo, co ja tutaj stwierdzam — że te datavizowe konwencje nie są oparte w sumie na niczym poza autorytatywną opinią:

Some rules are based on nothing more than the strong opinions of influential early writers in the field (like Edward Tufte and Jacques Bertin) and have not actually been subject to peer-reviewed research.


Przywołuje też w bonusie opinię rzeczywistego eksperta od kognicji wizualnej:

Steve Haroz, noted that he knew of know evidence that people read non-zero-baseline bar charts any differently than non-zero-baseline line charts. And, furthermore, that we should be careful in talking about data visualization "rules" when our evidence for them is weak or nonexistent.


I tweet Haroza:

Rely on evidence. When there is little or none, don't claim that some absolute or universal rule exists. It's fine to say "maybe" or "I prefer".


I drugi:

I know of no evidence to suggest that non-zero bar graphs are interpreted any differently than non-zero line graphs or dot plots. Every argument that could be made about the height of a bar could be made about the vertical position of a point


Co więc jednoznacznego można wywnioskować z opinii dwóch ekspertów, z których jedna uważa że taka twarda reguła istnieje, a drugi że w sumie nie wiadomo, ale nie mamy dobrych argumentów? Albo czy jakieś luźne zasady niepoparte w sumie niczym uprawniają do wyzywania ludzi? Nie mam pojęcia, ale może dlatego nie jestem w neuropie.

Taguję #neuropa, żeby poczytać kolejne wyzwiska pod moim adresem
#bekazprawakow #tvpis #bekazlewactwa
  • 39
@Crocetto: dobra type, krótka piłka: czy uważasz wykres TVP od którego się zaczęło za mający na celu manipulację czy wszystko jest tam git?


@babisuk: Ja Ci odpowiem, bo chyba mnie bardziej pytanie dotyczy. Tak uważam, wykres był nacelowany na propagandę i manipulacje. Ale nigdzie tego nie negowałem.
Wyznaję jednak zasadę że lepiej być bardziej poprawnym w krytyce niż mniej.

Widać to zresztą po drugim komentarzu moim.

(at)biesy: Manipulacje tutaj są
A small spot of potentially good news (depending on your stance) is that these axis manipulations didn’t seem to harm the actual reading of numerical values (people were more or less as accurate about guessing the actual numbers in the chart, no matter the chart type), only the subjective impression of the trend’s severity.


@babisuk: Jakbyś przeczytał blog do badania to byś wiedział że zmienia się tylko subiektywna percepcja.