Foute
Steekproeven |
|
|
In de statistiek moet een goede steekproef representatief
zijn. Daar bedoelen we iets mee als "eerlijk" of
"onbevooroordeeld". Als we een uitspraak over de bevolking van
Nederland willen doen aan de hand van een steekproef dan zal elke
"bevolkingsgroep" naar verhouding in deze steekproef moeten
voorkomen. Met "bevolkingsgroep" wordt bijvoorbeeld
bedoeld: man-vrouw, ouderen-jongeren,rokers-niet rokers,
zieken-gezonden, rood haar - blond haar - bruin haar .... en ga zo maar
door. |
|
Neem het volgende (overdreven)
voorbeeld:
Stel dat we een groep Nederlanders een enquête zouden sturen met daarin
de vraag "Vult U graag enquêtes in?" en we kijken naar
de teruggestuurde formulieren, dan zouden we waarschijnlijk de conclusie
kunnen trekken dat de overgrote meerderheid van Nederland graag
enquêtes invult!!
Degenen die dat niet doen gooien de enquête namelijk waarschijnlijk zo
snel mogelijk in hun prullenbak!
Zo past de steekproef zichzelf aan. 't Is eigenlijk net zo dom als een
steekproef per e-mail houden en de vraag "Heeft U een
computer" stellen. De conclusie zal ongetwijfeld zijn dat 100% van
de mensen een computer heeft....
|
|
Dit zijn natuurlijk wel heel domme voorbeelden, maar soms is het
fout zijn van een steekproef slechter te zien. Zo wilden twee leerlingen
op de middelbare school onderzoeken hoeveel er gerookt werd onder
scholieren. Ze gingen aan het begin van de pauze bij de buitendeur staan
en vroegen de eerste 50 leerlingen die naar buiten kwamen: Rook
je?"
Helaas komen natuurlijk in de pauze de rokers het eerst naar
buiten..... |
Soms is de fout nog moeilijker te herkennen: |
|
|
Een onderzoeksbureau kreeg van een gemeenteraad de
vraag "Hoe vol zijn de bussen in onze stad?" Men vroeg zich af
"Moeten we misschien meer bussen laten rijden?" Het bureau
besloot een enquête te houden onder buspassagiers. Alleen pakten ze het
nogal onhandig aan.
Aan een groot aantal mensen die rondliepen op het busstation vroeg men
simpelweg: "Met hoeveel mensen zat U in de bus?"
Het gemiddelde antwoord van al deze mensen zou dan immers wel de
gemiddelde busbezetting zijn.......?
Stel dat er 25 ritten zijn, met bezetting 1,2,3,4,...,24,25.
Dan is de gemiddelde bezetting natuurlijk gelijk aan 13
mensen per bus. |
Maar wat zeggen de passagiers die we ondervragen? Als de enquête
perfect is, en we ondervragen ALLE mensen, dan krijgen we deze
antwoorden:
1 zegt 1
2 zeggen 2
3 zeggen 3
4 zeggen 4
.
.
.
25 zeggen 25 |
|
|
|
Het gemiddelde van al deze getallen is: (1•1 +
2•2 + 3•3 + ....) / (1 + 2 + ... + 25) = 17.
FOUT DUS!!!
Het zit hem er natuurlijk in, dat er veel meer mensen zeggen dat de
bussen vol zijn, omdat er nou eenmaal meer mensen in een volle bus
zitten!
|
|
|