Wpis z mikrobloga

Hej, od dziś co kilka dni, dopóki się nie znudzę, pod tagiem #badzlogiczny, będę wrzucał najciekawsze błędy w logicznym rozumowaniu popełniane przez ludzi, media, polityków, itd. (tzw logical fallacies) razem z przykładami oraz objaśnieniem. Objaśnienia oraz przykłady będę opisywał własnymi słowami, więc zachęcam do dyskusji jeśli z czymś się nie zgadzacie :)

Bląd #1 - Base rate fallacy (zaniedbywanie miarodajności) - Błąd polega na pomijaniu prawdopodobieństwa zdarzenia w całej populacji przy określaniu prawdopodobieństwa konkretnego zdarzenia.

Przykład:

Najbardziej popularnym przykładem ilustrującym to zjawisko jest problem taksówki opisany przez noblistę Daniela Kahnemana:

W miasteczku, w którym istnieją jedynie 2 firmy taksówkarskie doszło do potrącenia pieszego przez taksówkę i ucieczki z miejsca zdarzenia. Pierwsza firma jeździ niebieskimi taksówkami i posiada 15 taksówek. Druga firma jeździ zielonymi taksówkami i posiada 85 taksówek.

Świadek zdarzenia w sądzie twierdzi, że taksówka, która potrąciła pieszego była niebieska. Podczas prób wiarygodności świadka, rozpoznawał on poprawnie kolor samochodu w podobnych warunkach pogodowych w 80% przypadków. Jakie jest prawdopodobieństwo, że taksówka była niebieska?

Większość z ludzi w obecnej sytuacji odpowie, że 80% ignorując pierwotne proporcje taksówek niebieskich i zielonych w całej populacji. Faktyczne prawdopodobieństwo, że była to taksówka niebieska wynosi ~41%, a nie 80%. Z czego to dokładnie wynika?

Wiemy, że świadek w 80% przypadków ma rację, a w 20% przypadków się myli. Wiemy też, że na pytanie "Jaka taksówka potrąciła pieszego?" odpowiedział "Niebieska". Powinniśmy zatem wziąć pod uwagę jakie są rzeczywiste szanse, że jeśli mówi "Niebieska", to taksówka była niebieska, a jakie, że zielona. Teraz pewnie wielu z Was myśli - przecież to jasne - w 80% ma rację, więc na 80% niebieska, case closed. Nie jest to jednak takie proste, ponieważ przy naszych rozważaniach musimy wziąć pod uwagę również liczbę taksówek w całej populacji (base rate).

Wiemy, że niebieskich taksówek jest 15, a zielonych 85 - razem jest ich 100. Zatem, jeśli świadek w 80% ma rację, to 12 z 15 (80%) niebieskich taksówek rozpozna jako niebieskie, a 3 z 15 (20%) niebieskich rozpozna niepoprawnie jako zielone oraz 68 z 85 (80%) z zielonych rozpozna jako zielone, a 17 z 85 (20%) zielonych rozpozna niepoprawnie jako niebieskie. Co za tym idzie, w całej populacji świadek rozpozna 29 taksówek (12 + 17) jako niebieskie, podczas gdy tylko 12 z nich rzeczywiście jest niebieskie. Z tego wynika, że prawdopodobieństwo niebieskiej taksówki potrącającej pieszego, biorąc pod uwagę ich liczbę w mieście oraz dokładność zeznań świadka wynosi 12/29, a więc ~41%, a nie 80% jak mogłoby się wydawać.

Podsumowując, zeznania świadka zwiększyły prawdopodobieństwo, że była to niebieska taksówka z 15% (można powiedzieć, że z naszego base rate) do 41%, co znacznie zmienia interpretację i pokazuje, że tak naprawdę bardziej prawdopodobne jest to, że pieszego potrąciła zielona taksówka.

Innym dobrym przykładem tego błędu logicznego są często wykrzykiwane w telewizji i mediach statystyki, na przykład:

"85% wypadków samochodowych zdarza się podczas pierwszych 7 kilometrów od startu podróży.", albo

"40% wypadków zdarza się w domu."

W pierwszym wypadku pomijamy całkowicie informację, że z klucza 85% wszystkich podróży samochodem jest krótsza niż 7 kilometrów. Nie oznacza to wcale, że jadąc w trasę dłuższą niż 7 kilometrów nagle prawdopodobieństwo wypadku spada do 15%, może być na przykład zdecydowanie większe. W drugim przypadku błędem jest to, że nie bierzemy pod uwagę przy interpretacji, że większość czasu spędzamy w domu, więc siłą rzeczy tam też będą zdarzały się wypadki.

mam nadzieję, że choć trochę #gruparatowaniapoziomu oraz #ciekawostki.
Pobierz
źródło: comment_4OYBT1Au0u7ZqDYZOyHRUqVq5kryF7Gk.jpg
  • 15
@slovrulez: Wydaje mi się, że dwa ostatnie przykłady zostały źle opisane.

"85% wypadków samochodowych zdarza się podczas pierwszych 7 kilometrów od startu podróży."


To może być prawdziwe i jednocześnie nie oznaczać, że prawdopodobieństwo wypadku w pierwszych 7 kilometrach podróży to 85%.

Prawdopodobieństwo to nie to samo co zwykłe proporcje. Gdyby to zdanie zamienić na:

"85% wypadków samochodowych zdarza się podczas pierwszych 7 kilometrów od startu podróży, więc prawdopodobieństwo wystąpienia wypadku w
@AmbiguousKeyboard: Fair point - bede pilnowal semantyki na przyszlosc. O to chodzi. Dzieki! Generalnie chodzilo mi o to, ze: w populacji rocznie jest 500 przejazdow samochodem. Np 450 z nich to przejazdy krotsze niz 7 km. 50 z nich to przejazdy dluzsze niz 7 km. Zalozmy, ze jest rocznie 30 wypadkow z czego 85% (25) jest podczas podrozy <7 km, a 15% (5) podczas podrozy >7km. Stad prawdopodobienstwo wypadku podczas podrozy