Een grote bron van misleiding is het
feit dat correlatie tussen twee dingen niet betekent dat er ook
een oorzakelijk verband is. Stel je voor dat medische onderzoekers
een aantal jaren lang bij een grote groep mensen over het hele
land verspreid bekijken hoeveel gevallen van polio er zijn in een
bepaalde periode, en dat
in een grafiek uitzetten tegen de hoeveelheid frisdank die men
gemiddeld per dag in die periode dronk. Stel dat dat de volgende
tabel oplevert;
F |
0,50 |
1,60 |
2,05 |
1,00 |
1,10 |
0,85 |
1,50 |
1,65 |
0,85 |
0,70 |
1,00 |
1,90 |
2,20 |
1,30 |
2,00 |
P |
1,25 |
3,10 |
3,00 |
1,80 |
2,30 |
1,75 |
2,60 |
2,70 |
0,85 |
1,25 |
1,25 |
3,10 |
2,75 |
1,55 |
2,60 |
F |
0,72 |
1,10 |
0,70 |
1,30 |
2,00 |
1,90 |
1,70 |
1,30 |
0,55 |
1,05 |
0,90 |
1,30 |
2,30 |
1,20 |
1,60 |
P |
1,25 |
1,55 |
1,50 |
1,95 |
3,40 |
2,75 |
2,35 |
2,70 |
0,75 |
1,75 |
1,50 |
2,05 |
3,50 |
1,80 |
2,10 |
Een brij van getallen....
|
|
|
Daarvan is dan eenvoudig het
alles-onthullende grafiekje hiernaast te maken.
Wie hier niet de duidelijk stijgende tendens ziet is
blind natuurlijk! ("positieve corrrelatie"
noemen de statistici dat).
De conclusie is overduidelijk: hoe meer frisdrank men
gebruikt, des te meer gevallen van polio.
Laten we er maar meteen een verontrustende krantenkop tegenaan
gooien: |
|
|
|
FRISDRANK
VERHOOGT KANS OP POLIO! |
|
(de conclusie kon net zo goed zijn "Van polio krijg je
dorst" natuurlijk, daar hebben we het elders op deze site nog
over).
Ondanks het duidelijk stijgende grafiekje slaat deze conclusie
toch helemaal nergens op, en dat komt door de aanwezigheid van een
zogenaamde "derde factor".
Laten we de tabel hierboven aanvullen met een derde rij die de
gemiddelde temperatuur in de meetperiode weergeeft:
F |
0,50 |
1,60 |
2,05 |
1,00 |
1,10 |
0,85 |
1,50 |
1,65 |
0,85 |
0,70 |
1,00 |
1,90 |
2,20 |
1,30 |
2,00 |
P |
1,25 |
3,10 |
3,00 |
1,80 |
2,30 |
1,75 |
2,60 |
2,70 |
0,85 |
1,25 |
1,25 |
3,10 |
2,75 |
1,55 |
2,60 |
T |
20 |
24 |
25 |
22 |
22 |
21 |
23 |
23 |
20 |
20 |
21 |
24 |
25 |
22 |
24 |
F |
0,72 |
1,10 |
0,70 |
1,30 |
2,00 |
1,90 |
1,70 |
1,30 |
0,55 |
1,05 |
0,90 |
1,30 |
2,30 |
1,20 |
1,60 |
P |
1,25 |
1,55 |
1,50 |
1,95 |
3,40 |
2,75 |
2,35 |
2,70 |
0,75 |
1,75 |
1,50 |
2,05 |
3,50 |
1,80 |
2,10 |
T |
21 |
22 |
21 |
23 |
25 |
25 |
24 |
23 |
20 |
21 |
20 |
22 |
25 |
22 |
23 |
Grafieken van P tegen T en van F tegen T zien er zó uit:
Wat blijkt: zowel F als P hebben een positieve correlatie
met T. Dat is vast te verklaren: als het warm is drinken de mensen
meer frisdrank, en als het warm is zal de polio-bacterie zich
sneller vermenigvuldigen. F en P hebben dus met elkaar niets
te maken; kijk maar naar de volgende grafiekjes van F tegen P bij
bepaalde vaste temperatuur:
Van die stijgende tendens is niets meer over.
Er is dus een derde factor (T) waarmee beiden positief correleren.
En zonder die extra T-rij in de tabel waren we daar nooit
opgekomen.
Ofwel: zo'n vervelende derde factor kan eigenlijk ALTIJD ergens
verborgen op de loer liggen!!!!! Heel frustrerend; je kunt pas
conclusies trekken als ALLE andere factoren gelijk zijn.
Maar wat zijn ALLE....?
Op dezelfde manier zou je kunnen concluderen:
|
ELK GOED
MEDICIJN VEROORZAAKT KANKER! |
|
Immers; als een medicijn goed is, dan verlengt het de
gemiddelde levensduur van de bevolking, dus nemen vanzelf het
aantal kankergevallen toe! Als mensen langer leven zullen ze ook
vaker kanker krijgen. Je moet toch érgens aan dood gaan? De
verborgen derde factor (de gemiddelde levensduur) zorgt er hier
voor dat elk medicijn positief correleert met het aantal
kankergevallen! |