© h.hofstede (h.hofstede@hogeland.nl)

Kruskal-Wallis toets.
       
Deze toets kun je gebruiken als er meer dan twee groepen zijn waarvoor een bepaalde grootheid is gemeten  (bij precies twee groepen gebruik je de Wilcoxon-toets). Daarbij is het niet noodzakelijk dat er iets bekend is over de verdeling van die gemeten grootheid: de toets is parametervrij.

Een waardeloze toets.

De toets zegt alleen OF er minstens één van de groepen significant afwijkt van de anderen. WELKE dat is, is na afloop nog onbekend: je zou om daar achter te komen vervolgens alle groepen per paar kunnen toetsen met een Wilcoxon-toets. Maar goed, dan kun je eigenlijk net zo goed direct alle groepen twee-aan-twee testen..... Eigenlijk is de Kruskall-Wallis toets dus een vrij waardeloze toets.
Zo, dat is een lekker didactisch verantwoord begin van deze les......

Hoe werkt deze waardeloze toets?
       
stap 1. Zet alle n meetwaarden van alle groepen samen op volgorde van klein naar groot, en geef ze een score van 1 tm n.
Bij gelijke stand moet je de scorepunten verdelen.
De gemiddelde score van al die n meetwaarden is dan  0,5(n + 1), en die noemen we sgem.
       
stap 2. Bereken voor elke groep de gehaalde gemiddelde score, die noemen we si
Bereken vervolgens voor iedere groep   ni • (si - sgem)2  
Tel al  deze gevonden getallen bij elkaar op, dat  noemen we  Sgroepen
       
stap 3. Tel nu van alle afzonderlijke metingen alle  (s - sgem)2  bij elkaar op.  Noem dit  Stotaal
       
stap 4. Bereken de toetsgrootheid  T =  (n - 1) • Sgroepen/Stotaal
       
stap 5. Voor kleinere waarden van n moet je tabellen gebruiken om de kritieke waarden voor Tn te vinden. Die zijn er tot n ongeveer 35. Maar voor elke combinatie van groepsgroottes zijn er aparte tabellen nodig.
Voor grotere waarden van n (vanaf ongeveer minstens 5 metingen per groep) volgt T een  χ2-verdeling met vrijheidsgraden:  df = aantal groepen - 1. Dan kun je daar de kritieke waarde vinden.
       
De tabellen voor kleine groepen kun je vinden bij:
Voor drie groepen tot maximaal 35 per groep HIER  (een pdf van 196 bladzijden!).
Voor vier groepen tot maximaal 10 per groep  HIER   (een pdf van 19 bladzijden).
    (bron:
Meyer, J. P., & Seaman, M. A. (2014). A comparison of the exact Kruskal-Wallis distribution to asymptotic approximations for all sample sizes up to 105. Journal of Experimental Education, 81(2), 139-156.
Meyer, J. P., & Seaman, M. A. (2008). Expanded table of the Kruskal-Wallis statistic. Retrieved from http://www.faculty.virginia.edu/kruskal-wallis/. )
Voor vijf groepen tot maximaal 3 per groep  HIER.
Voor vier even grote groepen tot maximaal 25 per groep  HIER.
Voor vijf even grote groepen tot maximaal 25 per groep  HIER.
Voor zes even grote groepen tot maximaal 25 per groep  HIER.
       
stap 6 Als onze gemeten T groter is dan de kritieke waarde (uit de tabel of de χ2-verdeling), dan is er een significant verschil:  er is dan minstens één groep verschillend van de anderen.
       
Een waardeloos voorbeeld.
       
Van vier basisscholen is het gewicht van een aantal kinderen uit groep 8 gemeten. Dat gaf de volgende meetwaarden (gewichten in kg):
       
De Rank 32 36 26 27 34 28 33 31 42 35
De Petteflet 26 29 32 34 28 38 32 35 40 41
De Witte Olifant 34 36 38 32 42 45 34 29 32 39
't Palet 30 29 26 42 38 33 35 35 37 31
       
Ai!
Die Witte-Olifanters lijken wel wat zwaar!  Zouden ze significant zwaarder zijn? 

Laten we dat onderzoeken met een significantieniveau α = 0,05.

Eerst maar eens alles op volgorde zetten en een score geven:
       
gewicht 26 26 26 27 28 28 29 29 29 30 31 31 32 32 32 32 32 33 33 34
score 2 2 2 4 5,5 5,5 8 8 8 10 11,5 11,5 15 15 15 15 15 18,5 18,5 21,5
       
gewicht 34 34 34 35 35 35 35 36 36 37 38 38 38 39 40 41 42 42 42 45
score 21,5 21,5 21,5 25,5 25,5 25,5 25,5 28,5 28,5 30 32 32 32 34 35 36 38 38 38 40
       
De gemiddelde score is  0,5 • 41 = 20,5
Voeg een rij  (s - 20,5)2  toe:
       
gewicht 26 26 26 27 28 28 29 29 29 30 31 31 32 32 32 32 32 33 33 34
score  s 2 2 2 4 5,5 5,5 8 8 8 10 11,5 11,5 15 15 15 15 15 18,5 18,5 21,5
(s - 20,5)2 342,25 342,25 342,25 272,25 225 225 156,25 156,25 156,25 110,25 81 81 30,25 30,25 30,25 30,25 30,25 4 4 11
       
gewicht 34 34 34 35 35 35 35 36 36 37 38 38 38 39 40 41 42 42 42 45
score 21,5 21,5 21,5 25,5 25,5 25,5 25,5 28,5 28,5 30 32 32 32 34 35 36 38 38 38 40
(s - 20,5)2 1 1 1 25 25 25 25 64 64 90,25 132,25 132,25 132,25 182,25 210,25 240,25 306,25 306,25 306,25 380,25
       
De totaalscore is de som van die onderste rij:  Stotaal =  5307
Groepsscores:
De Rank:  som  170, dus  s = 17  en  10 (17 - 20,5)2 = 122,5
De Petteflet:    som  195,5, dus  s = 19,5  en  10 (19,5 - 20,5)2 = 10
De Witte Olifant:  som 253.5, dus  s = 25,35  en  10 (25,35 - 20,5)2 = 235,225
't Palet:  som 201, dus  s = 20,1  en  10 (20.1 - 20.5)2 = 1,6

De  groepensom wordt dan  Sgroepen =  122,5 + 10 + 235,225 + 1,6 = 369,325
T = 39 • 369,325/5307 = 2,71
De tabel van kritieke waarden geeft bij 4 groepen van 10 en α = 0,05  een kritieke waarde van 7,586
Onze gevonden T-waarde is kleiner dan de kritieke waarde dus we nemen H0 aan:  er is geen verschil tussen de groepen.
(merk nog even op dat de χ2-waarde bij 3 vrijheidsgraden gelijk is aan 7,81 en dat dat al aardig in de buurt van die 7,586 zit).
       
       
       

© h.hofstede (h.hofstede@hogeland.nl)