|
|||||||||||||||||||||||||||||||
Een verdeling testen. | |||||||||||||||||||||||||||||||
Als je de
χ2-verdeling kunt gebruiken om de kwaliteit van een fit
te testen (zie de vorige les),
dan kun je er dus ook mee kijken hoe goed een serie meetgegevens aan een
bepaalde verdeling voldoet. Dat is immers ook een soort van "fit-testen". Neem bijvoorbeeld het aantal meisjes in een gezin van 5 kinderen. Als bij elke geboorte de kans op een meisje hetzelfde is, dan verwachten we dat deze verdeling binomiaal is, met n = 5 en p = de kans op een meisje. Stel dat we de volgende nulhypothese willen toetsen: |
|||||||||||||||||||||||||||||||
H0: de verdeling van meisjes is binomiaal. |
|||||||||||||||||||||||||||||||
Laten we nemen
α = 0,05. Een uitgebreid onderzoek onder 632 gezinnen van 5 kinderen leverde de volgende tabel op: |
|||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||
We willen nu graag
deze gemeten frequenties vergelijken met de verwachte frequenties. Maar
het probleem is: die verwachte frequenties kunnen we niet
berekenen want we weten niet wat p (kans op een meisje) is.
Zomaar p = 0,5 stellen is niet goed, want we testen de
hypothese "de verdeling is binomiaal" en niet de hypothese "de verdeling
is binomiaal met p = 0,5" Daarom maken we uit onze metingen eerst een schatting van p Er waren 0 • 9 + 1 • 90 + 2 • 150 + 3 • 242 + 4 • 114 + 5 • 27 = 1707 meisjes bij 5 • 632 = 3160 geboorten. Dat is een kans van 1707/3160 = 0,54 We schatten daarom p = 0,54 en kunnen nu wel de verwachte frequenties berekenen: |
|||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||
Dat geeft
χ2 = 14,05 (de som van de laatste kolom). In de vorige les was het aantal vrijheidsgraden steeds één minder dan het aantal metingen. Maar omdat we hier de p = 0,54 eerst uit de gegevens zélf hebben bepaald moet het aantal vrijheidsgraden nu nóg één minder worden. Dus niet 6 - 1 = 5 maar 6 - 1 - 1 = 4. Als je de eerste 5 frequenties zou weten en ook dat p = 0,54 zou je de laatste frequentie (27) immers gewoon daaruit kunnen berekenen. In het algemeen geldt: |
|||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||
Met 4 vrijheidsgraden
vinden we bij
α = 0,05 een grenswaarde
van
χ2 = 9,49 (tabel van de vorige les) Onze gevonden χ2 is groter, dus we moeten H0 verwerpen. De verdeling is niet binomiaal. |
|||||||||||||||||||||||||||||||
• | Merk nog op dat het wél nodig is om die p eerst uit de metingen te schatten . Als je gewoon botweg vooraf stelt p = 0,5 dan weet je niet hoeveel van de χ2 afkomstig is van het feit dat de verdeling niet binomiaal is, en hoeveel van het feit dat de verdeling niet rond p = 0,5 gecentreerd is. | ||||||||||||||||||||||||||||||
• | Merk ook nog op dat je bij het testen van een normale verdeling twee parameters moet schatten, namelijk μ en σ. Daarom zal het aantal vrijheidsgraden met twee afnemen. | ||||||||||||||||||||||||||||||
© h.hofstede (h.hofstede@hogeland.nl) |