Simpsonov paradoks: Razlika med redakcijama
Zanimiv statistični paradoks |
(ni razlike)
|
Redakcija: 11:44, 25. september 2009
Símpsonov paradóks je znan statistični paradoks. Gre za navidezno protislovni pojav, ko so rezultati statistične raziskave na celotni populaciji povsem drugačni, kot pa če populacijo razdelimo na dve skupini (ali več) in raziskavo opravimo na posamičnih skupinah.
Pojav je že leta 1903 odkril Udny Yule, podrobneje pa ga je razisoval Edward H. Simpson s sodelavci leta 1951.
Zgledi
Uspešnost moških in žensk
Šola ima dva oddelka (označimo ju A in B). Ob vpisu se na šolo prijavi 510 moških in 510 žensk. Od prijavljenih kandidatov jih sprejmejo samo nekaj - podake prikazuje naslednja tabela:
Moški | Ženske | |
---|---|---|
Oddelek A | 500 prijav, 50% sprejetih | 10 prijav, 90% sprejetih |
Oddelek B | 10 prijav, 10% sprejetih | 500 prijav, 20% sprejetih |
Skupaj | 251/510 sprejetih = 49% | 109/510 sprejetih = 21% |
Opazimo, da je na oddelku A delež sprejetih med ženskami višji kot med moškimi, enako pa velja tudi za oddelek B. Zanimivo pa je za šolo kot celoto delež sprejetih višji med moškimi.
Ta rezultat je presenetljiv in na prvi pogled protisloven. Ob podrobnejšem pregledu podatkov pa se izkaže, da je bilo na oddelku A pravzaprav število sprejetih žensk zelo majhno (kljub visokemu procentu); na oddelku B pa je bilo sicer procentualno sprejetih več žensk kot moških, vendar pa je delež sprejetih v celoti zelo nizek. Zato nas ne sme presenetiti ugotovitev, da je šola kot celota sprejela več moških kot žensk.
Ledvični kamni
Simpsonov paradoks pogosto srečamo tudi v medicinskih statistikah.
Naslednji zgled prikazuje uspešnost zdravljenja ledvičnih kamnov po dveh metodah.
Metoda A | Metoda B |
---|---|
78% (273/350) | 83% (289/350) |
Metoda B je videti uspešnejša - procent uspešnih ozdravljenj je višji kot pri metodi A.
Zdaj pa se odločimo, da bomo paciente ločili glede na velikost ledvičnih kamnov. Rezultati za isto populacijo pacientov so zdaj takšni:
Metoda A | Metoda B | |
---|---|---|
Majhni kamni | 1. skupina 93% (81/87) |
2. skupina 87% (234/270) |
Veliki kamni | 3. skupina 73% (192/263) |
4. skupina 69% (55/80) |
Skupaj | 78% (273/350) | 83% (289/350) |
Zdaj pa je videti, da je uspešnejša metoda A, saj smo dobili višji procent uspešnosti po metodi A tako za majhne kot tudi za velike ledvične kamne.
Navidezno protislovje izhaja iz dejstva, da zdravniki dejansko uporabljajo metodo A (ki je zahtevnejša in dejansko boljša) zlasti pri težkih primerih velikih kamnov, metodo B (ki je preprostejša) pa pri lažjih primerih bolezni, tj. pri majhnih kamnih. Zato tudi sta v zgornji tabeli prevladujoči skupini 2 in 3, skupini 1 in 4 pa sta bistveno manjši. Ker pa so težki primeri dejanski teže ozdravljivi, jim niti boljša metoda A ne pomaga vedno in zato je v skupnem seštevku metoda A videti manj uspešna.