Sprawa niesłusznie skazanej Sally Clark - przykład prosecutor's fallacy

Niewinna Sally Clark została oskażona o zabójstwo dwójki swoich dzieci. Głównym argumentem prokuratora był błędnie wyciągnięty wniosek bazujący na rachunku prawdopodobieństwa. Cała sprawa zakończyła się przedwczesną śmiercią oskarżonej. Na czym polegały błędy prokuratora? Też dałbyś się nabrać?

kondiz z dodany: 01.03.2014, 16:12:45

36
- Facebook
- Twitter

Według mnie rachunek prawdopodobieństwa to jedna z najbardziej zwodniczych dziedzin matematyki. Myślę, że wynika to głównie z tego, iż wydaje się ona intuicyjna, pytania są zwykle postawione w prostym języku powszechnym, a rozwiązania bywają zawiłe i wymagają zauważenia dodatkowych własności.

W minionym tygodniu na zajęciach z data miningu prowadzący wspomniał nam o procesie Sally Clark, który chciałbym tutaj przedstawić dodając przy tym matematyczny komentarz.

Myślę, że historia procesu jest dość dobrze opisana na serwerach polskiej Wikipedii: //pl.wikipedia.org/wiki/Sally_Clark , więc nie będę jej tutaj przepisywał. Dodałbym jedynie, że pomimo uniewinnienia czas spędzony w więzieniu miał na życie Sally negatywny wpływ. Zmarła w 2007 roku (cztery lata po zwolnieniu) z powodu zatrucia alkoholowego.

Dlaczego profesor pediatrii Roy Meadow się mylił? Podobnie jak w poprzednich znaleziskach postaram się wszystko opisać w taki sposób, aby każdy był w stanie zrozumieć główną ideę.

W rozumowaniu Roya można doszukać się dwóch błędów.

Pierwszy z nich (o wiele łatwiejszy to wytypowania) to błędne założenie niezależności śmierci jednego dziecka od zdarzenia śmierci drugiego. Co to oznacza?
Jeżeli rozważalibyśmy dwójkę losowo wybranych noworodków na świecie, to ich śmierć łóżeczkowa faktycznie zdarzałaby się jak 1 do 8543 x 8543, czyli mniej więcej 1 do 73 milionów. Jednak w tym przypadku rozważane dzieci łączyło bardzo wiele - mieli tę samą matkę i byli wychowani w podobnych warunkach. Można się spodziewać, że te zmienne wpływają znacząco na śmierć łóżkową, a zatem nie mamy podstaw do mnożenia prawdopodobieństw. Jednakże drugi błąd Pana Meadow był o wiele gorszy.

Bardzo popularnym błędem, który tutaj także został popełniony, jest tak zwany "prosecutor's fallacy". Tak naprawdę ma on kilka odmian, a wytłumaczenie wersji popełnionej przez Roya wymaga użycia prawdopodobieństwa warunkowego, które nie wszystkim jest znane, więc nie będę się nad nim skupiał. Zaprezentuję jednak inną, prostszą odmianę "prosecutor's fallacy".

Wyobraźmy sobie sytuację, w której udało nam się odnaleźć DNA sprawcy na miejscu zbrodni i chcemy go odnaleźć. Załóżmy, że prawdopodobieństwo, iż dwa profile DNA pochodzące od innych osób będą ze sobą zgodne przez przypadek to 1 do 10000. Przeszukujemy naszą bazę osób notowanych (wielkości 20 tysięcy) i okazuje się, że znaleźliśmy tam osobę, której DNA pokrywa się z DNA sprawcy.
Jakie jest prawdopodobieństwo, iż podejrzany jest niewinny?
Większość osób odpowie że jest to jedynie 1 do 10000 i przychyli się do osądzenia podejrzanego. Niestety wszyscy, którzy tak odpowiedzą dali się zwieść intuicji. Dlaczego?
Załóżmy, że nikt z naszej bazy 20 000 nie jest sprawcą. Wtedy dla każdego DNA prawdopodobieństwo, iż zostanie ono połączone z DNA sprawcy przez przypadek to jedynie 1 do 10000. Zatem zgodnie z prawdą nie wykryjemy podobieństwa na 99,99%. Problem leży w tym, że nasza baza to aż 20 000 osób, więc prawdopodobieństwo, że zgodnie z prawdą żaden z testów nie wykryje połączenia to 99,99% do potęgi 20 000. Daje to niecałe 13,5%. To oznacza, że w naszej grupie 20 000 osób istnieje ponad 86% prawdopodobieństwo, iż przez przypadek połączymy DNA sprawcy z którymś DNA w bazie!

Z pomocą w przypadku rozwiązywania problemów związanych z "prosecutor's fallacy" przychodzi Twierdzenie Bayesa.
Osoby bardziej zainteresowane tematem zapraszam ponownie na polską Wikipedię //pl.wikipedia.org/wiki/Twierdzenie_Bayesa . Jest tam świetnie przedstawiona teoria z bardzo klarownym przykładem na samym końcu.

Dziękuję za dotarcie do końca.

Komentarze (36)

najlepsze

gre

01.03.2014, 19:49:54

Wspomniane pod koniec artykułu 86% to prawdopodobieństwo, że w bazie osób notowanych znajdziemy co najmniej jedno dopasowanie.

Pozwolę sobie wrócić do pytania zadanego wcześniej:

Przeszukujemy naszą bazę osób notowanych (wielkości 20 tysięcy) i okazuje się, że znaleźliśmy tam osobę, której DNA pokrywa się z DNA sprawcy. Jakie jest prawdopodobieństwo, iż podejrzany jest niewinny?

To jest zupełnie inny problem, a wynik zależy od tego jaką część populacji mamy w naszej bazie. Jeśli mamy

kondiz

02.03.2014, 15:06:55

@gre: To nie jest kompromis, ale to jest swojego rodzaju "kompromis" ;) Mam na myśli, iż celowo użyłem cudzysłowu.

gre

02.03.2014, 13:43:47

@kondiz: A ja nigdzie nie napisałem, że wynik jest błędny. Po prostu brakowało mi w artykule odpowiedzi, skoro już stawiamy pytanie. Możesz to potraktować jako uzupełnienie. :-)

Jeszcze tyko jedno: to nie jest "kompromis" między 86% a 0,01%. To jest zupełnie inny problem i te 86% nie mają tu nic do rzeczy.

mactrix

01.03.2014, 20:51:14

Kiedyś jedna radczyni, a zarazem wykładowczyni prawa na UJ, prawna powiedziała mi, że w sądzie nie ma sprawiedliwości, wygrywa ten kto będzie miał lepszą linię obrony lub ataku. Wiadomo, że w sprawach oczywistych jak np. zarejestrowane kamerą zabójstwo czy kradzież nie da się zrobić nic, ale właśnie w przypadku pani Clark wyszła cała niesprawiedliwość. Nie wiem jak odpowiedział tamten gostek za swój błąd, ale zniszczył co najmniej jedno życie.

Koller

02.03.2014, 00:45:13

@mactrix:

Zarejestrowane kamerą kradzież nie da się zrobić nic

Dosłownie :d czasem jest wszystko na kamerze, albo wiadomo kto to, a i tak nikogo nie znajdą

g....._

konto usunięte 01.03.2014, 19:35:08

Nawet jeśli założylibyśmy, że można uznać prawdopodobieństwo śmierci obojga rodzeństwa za 1 : 73m to statystycznie w UK przy średniej liczbie urodzin na poziomie 800k rocznie takie przypadki zdarzają się raz na około 90 lat.

dajlmilnusa

02.03.2014, 00:11:37

-2

@grucha_: to jest prawdopodobieństwo dla losowo wybranych noworodków, a nie losowo wybranego rodzeństwa

D.....p

konto usunięte 01.03.2014, 17:23:12

Swietny i ciekawy wykop, dzieki.

xinn

01.03.2014, 20:40:28

O "Prosecutor's fallacy" jest fenomenalny występ na tedtalk, w którym pokazane są również inne błędy związane ze statystyką. Zapraszam:

http://www.ted.com/talks/peter_donnelly_shows_how_stats_fool_juries.html

BladaDupa

01.03.2014, 22:07:27

@xinn: W sumie jest tam podany dokładnie ten sam przykład, który porusza @kondiz w tym wykopie.

Jest też inna bardzo dobra prelekcja blisko tego tematu: http://www.ted.com/talks/anne_milgram_why_smart_statistics_are_the_key_to_fighting_crime.html

v.....q

konto usunięte 01.03.2014, 18:36:57

Sprawa podła, o tyle, że ktoś zapomniał o podstawowej zasadzie domniemania niewinności. To że coś jest prawdopodobne lub nie to nie fakt. Słynne wyroki sądowe w sprawie Słowika i podobnych. Mogli to prawdopodobnie zrobić. Ale skoro nie ma mocnych dowodów to sąd nie przychylił się do wniosku prokuratury. Ale sprawa miała miejsce w USA, tam wszystko jest możliwe. Nawet odszkodowanie za oblanie się kawą.

gophffer

01.03.2014, 21:16:47

@vladimirq: to było w GB a nie USA...

I.....a

konto usunięte 01.03.2014, 22:28:00

@vladimirq: Co do odszkowania za kawę to warto, żebyś wcześniej chociaż pobieżnie zapoznał się ze sprawą, a nie tylko powielał głupoty.

P.....k

konto usunięte 01.03.2014, 23:13:50

Tak się kończy olewanie podstawowych zasad prawa, takich jak in dubio pro reo. Nie można kierować się w sądzie rachunkiem prawdopodobieństwa, muszą być dowody lub chociaż wiarygodne zeznania świadków. I tak mogą zdarzać się pomyłki, ale tutaj moim zdaniem sąd spieprzył sprawę po całości.

k.....k

konto usunięte 01.03.2014, 23:34:17

@Piotrusiek: Myślę, że samo bazowanie na zeznaniach świadków, jest tak samo wiarygodne jak posługiwanie się rachunkiem prawdopodobieństwa. Może tak, może tak. Powinny tylko uzupełniać i sklejać w jedną całość, faktyczne dowody. Fakt, jak bardzo umysł płata figle, wiem po pewnym odrobinę traumatycznym wydarzeniu ze swojego życia. Pamiętam scenerie dokładnie scenerie ale.... widzę całość w odbiciu lustrzanym. Domek jest po lewej stronie, mimo że po rozmowach z rodziną i odwiedzeniu tego miejsca,

xvovx

02.03.2014, 00:13:06

@k0pernik:

Przynajmniej dałbym sobie głowę uciąć, że są wiarygodne. A jak widzisz, domek jednak jest po prawej.

Heh, dobry motyw, ale to jeszcze nic. ;)

Ja "pamiętam", że w pewnym zdarzeniu uczestniczyła osoba, która (jak udało się ponad wszelką wątpliwość ustalić) w tym samym czasie przebywała jakieś 200 km od miejsca zdarzenia. ;D

measure

02.03.2014, 14:03:40

Tę (i nie tylko tę) pułapkę błędnego rozumienia zasad rachunku prawdopodobieństwa świetnie opisuje w książce "Matematyka niepewności. Jak przypadki wpływają na nasz los" Leonard Mlodinow. Książka jest pisana w ten sposób, by była zrozumiała nie tylko dla matematyka - można ją spokojnie polecić każdemu. Czyta się świetnie, a przykłady są nie tylko interesujące, ale czasem wręcz szokujące (jak właśnie sprawa Sally Clark). Poza tym jest na wysokim poziomie merytorycznym (a to coraz

dajlmilnusa

02.03.2014, 01:11:05

Komentarz usunięty przez moderatora

xvovx

02.03.2014, 00:05:13

A czy to nie jest przypadkiem tak, że po wystąpieniu danego zdarzenia prawdopodobieństwo wystąpienia każdego następnego "zeruje się" (w sensie, że wraca co wartości wyjściowej)? O podnoszeniu prawdopodobieństw do potęgi możemy przecież mówić tylko w przypadku, gdy wszystkie zdarzenia, których ono dotyczy są przyszłością.

Tak samo jak słynna swego czasu sprawa wylosowania w Bułgarii dwa razy pod rząd tych samych liczb w lotto. Po zdarzeniu pierwszym prawdopodobieństwo zdarzenia drugiego polegającego na wylosowaniu

xvovx

02.03.2014, 01:06:04

@dajlmilnusa:

ale nie mówimy co jest po pierwszym tylko po dwóch.

A co to za różnica? Jeśliby dwoje dzieci już umarło, a było jakieś trzecie to prawdopodobieństwo jego śmierci byłoby wciąż 1:8500. To z jakiej racji prawdopodobieństwo śmierci dwójki poprzednich miałoby wynosić 1:74000000?

xvovx

02.03.2014, 00:32:20

@dajlmilnusa:

Tutaj chodziło o prawdopodobieństwo śmierci dwóch wybranych dzieci, a nie tylko jednego a potem kolejnego.

I prawdopodobieństwo śmierci dwóch wybranych (jeszcze żywych!) dzieci wynosi faktycznie 1:74000000. Jednakże gdy ta sama dwójka już nie żyje, to prawdopodobieństwo ich śmierci sprowadza się do prawdopodobieństwa śmierci każdego z nich z osobna.