© h.hofstede (h.hofstede@hogeland.nl)

Onafhankelijkheidstabellen
       
Van een grote groep basisschoolleerlingen is de hoeveelheid zakgeld gevraagd, en dat leverde de volgende frequentietabel op:
       
  hoeveelheid zakgeld (€ per week)
geslacht 0 -< 5 5 -< 10 10 -< 15
meisje 29 45 7
jongen 24 19 6
       
De vraag is nu:  zijn de factoren "geslacht" en  "hoeveelheid zakgeld"  afhankelijk of onafhankelijk van elkaar?
Laten we beginnen met de nulhypothese  H0:  "er is geen afhankelijkheid" en laten we die gaan testen met α = 0,05.

In totaal zijn er 130 kinderen gevraagd.
Eerst breiden we de tabel uit met de totale relatieve frequenties.
       
  hoeveelheid zakgeld (€ per week)  
geslacht 0 -< 5 5 -< 10 10 -< 15 relatieve freq.
meisje 29 45 7 0,623
jongen 24 19 6 0,377
relatieve freq. 0,408 0,492 0,100  
       
Als de twee factoren onafhankelijk van elkaar zijn, dan kunnen we de kansen op de verschillende aantallen vinden door  steeds twee kansen met elkaar te vermenigvuldigen, immers  P(A en B) = P(A) • P(B)
Dus bijvoorbeeld de kans op een meisje dat 5-10 euro zakgeld krijgt is 0,623 • 0,492 = 0,307
Dat geeft de volgende tabel:
       
  hoeveelheid zakgeld (€ per week)  
geslacht 0 -< 5 5 -< 10 10 -< 15 relatieve freq.
meisje 0,254 0,307 0,062 0,623
jongen 0,154 0,185 0,038 0,377
relatieve freq. 0,408 0,492 0,100  
       
Met deze nieuwe kansen kunnen we nu weer de verwachte aantallen (E) per categorie uitrekenen
       
  hoeveelheid zakgeld (€ per week)  
geslacht 0 -< 5 5 -< 10 10 -< 15 relatieve freq.
meisje 33,02 39,91 8,06 0,623
jongen 20,02 24,05 4,94 0,377
relatieve freq. 0,408 0,492 0,100  
       
Tenslotte kunnen we weer op de oude vertrouwde χ2-manier de afwijkingen   (O - E)²/E voor elke categorie berekenen:
       
  hoeveelheid zakgeld (€ per week)
geslacht 0 -< 5 5 -< 10 10 -< 15
meisje 0,49 0,65 0,14
jongen 0,79 1,07 0,23
       
De som van al deze afwijkingen is  χ2 = 3,37
Het aantal vrijheidsgraden is nu  slechts 2.
Dat kun je zó zien:  als de bovenste rij gegeven is, is de onderste rij ook bekend. En als de eerste en tweede kolom gegeven zijn ligt de derde ook vast. Daarom blijven er 1 rij en 2 kolommen over, en dat geeft 2 cellen. 
       
vrijheidsgraden = (aantal rijen - 1) • (aantal kolommen - 1)
       
Vrijheidsgraden 2 met α = 0,05 geeft een grenswaarde van 5,99 (opzoeken in de χ²-tabel)
Onze waarde is kleiner, dus we mogen H0 aannemen:  de factoren  "hoeveelheid zakgeld" en "geslacht" zijn onafhankelijk.
       
Continuïteitscorrectie.

Als je te maken hebt met een 2×2-tabel, dan heb je maar één vrijheidsgraad over!
Dat betekent dat je een continuïteitscorrectie moet toepassen:   alle gemeten frequenties moeten 0,5 naar het midden toe worden verschoven.

voorbeeldje.

Een winkelketen wil nagaan of er een verband is tussen het verkopen van een televisie en het geslacht van de verkoper  (zijn vrouwen of mannen betere verkopers?). Men meet van 80 verkopers (40 mannen en 40 vrouwen) of ze bij het eerste contact met een klant die naar een televisie vraagt wel of niet een televisie verkopen. Dat gaf de volgende tabel:

       
geslacht verkoper wel een verkoop geen verkoop totaal
man 28 12 40
vrouw 22 18 40
  50 30 80
       
Omdat dit een 2×2-tabel is (1 vrijheidsgraad), moeten we de gemeten frequenties met 0,5 naar de verwachte verschuiven. Dat geeft dus:
       
geslacht verkoper gecorrigeerde frequentie verwachte frequentie totaal
  wel verkoop geen verkoop wel verkoop geen verkoop  
man 27,5 12,5 25 15 40
vrouw 22,5 17,5 25 15 40
  50 30 50 30 80
       
χ2(27,5 - 25)²/25(12,5 - 15)²/15 + (22,5 - 25)²/25(17,5 - 15)²/15 =  1,33
De kritieke waarde voor χ2  (α = 0,05 en tweezijdig bij 1 vrijheidsgraad)  is 3,84.
Conclusie:  er is geen significant verband tussen het geslacht van de verkoper en het wel of niet kopen door een klant.
       

© h.hofstede (h.hofstede@hogeland.nl)