© h.hofstede (h.hofstede@hogeland.nl)

Kolmogorov-Smirnov test.
       
De Kolmogorov-Smirnov test onderzoekt of twee series van meetwaarden afkomstig zijn uit dezelfde frequentieverdeling. Je kunt hem ook gebruiken met één serie meetwaarden, en die vergelijken met een bekende verdeling. Meestal om te onderzoeken of een serie meetwaarden normaal  verdeeld is.

De test tekent van beide verdelingen een cumulatief frequentiepolygoon en bepaalt de maximale verticale afstand tussen die twee polygonen.
Neem de volgende serie van 225  meetwaarden:
 
meting 0-10 10-20 20-30 30-40 40-50 50-60 60-70 70-80 80-90 90-100
frequentie 4 8 15 24 45 50 40 21 12 6
       
Het gemiddelde is 52,87 en de standaarddeviatie is 19,11
Als we nu willen onderzoeken of deze waarden afkomstig zijn uit een normale verdeling, dan nemen we die standaarddeviatie en dat gemiddelde en maken een cumulatief frequentiepolygoon van zowel deze tabel als van de bijbehorende normale verdeling.
       
meting 0-10 10-20 20-30 30-40 40-50 50-60 60-70 70-80 80-90 90-100
relatieve cumulatieve frequentie 0,018 0,053 0,120 0,226 0,427 0,649 0,827 0,920 0,973 1,000
cumulatieve frequentie normale verdeling 0,012 0,043 0,116 0,250 0,440 0,645 0,815 0,922 0,974 0,993
afwijking 0,006 0,010 0,004 0,024 0,013 0,004 0,012 0,002 0,001 0,007
       
Die derde rij is dus gemaakt met  normalcdf(-∞, 10, 52.87, 19.11)  en  normalcdf(-∞, 20, 52.87, 19.11)  enz.
De grootste absolute afwijking is 0,024 (bij de klasse 30-40)
       
De volgende tabel geeft nu de kritieke waarden voor de gevonden maximale afwijking, afhankelijk van het aantal metingen n.
       
n α = 0,01 α = 0,05 α = 0,10 α = 0,15 α = 0,20
1 0,995 0,975 0,950 0,925 0,900
2 0,929 0,842 0,776 0,726 0,684
3 0,828 0,708 0,642 0,597 0,565
4 0,733 0,624 0,564 0,525 0,494
5 0,669 0,565 0,510 0,474 0,446
6 0,618 0,521 0,470 0,436 0,410
7 0,577 0,486 0,438 0,405 0,381
8 0,543 0,457 0,411 0,381 0,358
9 0,514 0,432 0,388 0,360 0,339
10 0,490 0,410 0,368 0,342 0,322
11 0,468 0,391 0,352 0,326 0,307
12 0,450 0,375 0,338 0,313 0,995
13 0,433 0,361 0,325 0,302 0,284
14 0,418 0,349 0,314 0,292 0,274
15 0,404 0,338 0,304 0,283 0,266
16 0,392 0,328 0,295 0,274 0,258
17 0,381 0,318 0,286 0,266 0,250
18 0,371 0,309 0,378 0,259 0,244
19 0,363 0,301 0,272 0,252 0,237
20 0,356 0,294 0,264 0,246 0,231
25 0,320 0,270 0,240 0,220 0,210
30 0,290 0,240 0,220 0,200 0,190
35 0,270 0,230 0,210 0,190 0,180
40 0,250 0,210 0,190 0,180 0,170
45 0,240 0,200 0,180 0,170 0,160
50 0,230 0,190 0,170 0,160 0,150
meer dan
50
1,63/n 1,36/n 1,22/n 1,14/n 1,07/n
       
Neem bijvoorbeeld significantieniveau α = 0,10
Onze test bestond uit 225 meetwaarden, dus de kritieke waarde voor de afwijking is dan 1,22/√225 = 0,081
Onze gevonden afwijking (0,024) is kleiner, dus onze verdeling voldoet goed aan de gegeven normale verdeling.
       
       
  OPGAVEN
       
1. Hieronder staan vier frequentieverdelingen.
Onderzoek welk van dezen afkomstig zouden kunnen zijn van een normale verdeling.
Onderzoek van de verdelingen waarbij dat niet zo is, of deze meetwaarden uit dezelfde (andere) verdeling afkomstig kunnen zijn.
Neem elke keer α = 0,05
       
   
       
       
       
       
       
       
       
       
       
       
       
       
       
       
       
       
       
       
       
       
       

© h.hofstede (h.hofstede@hogeland.nl)