© h.hofstede (h.hofstede@hogeland.nl)

De standaarddeviatie schatten.
       
Stel dat we een normaal-verdeelde populatie hebben met gemiddelde μ en standaarddeviatie σ. Beiden nog onbekend.
Tot nu toe maakten we een schatting van σ aan de hand van s (de standaarddeviatie van onze steekproef) met als doel een betrouwbaarheidsinterval voor μ te vinden.  Bij grote steekproeven namen we gewoon σ = s  en bij kleinere moesten we rekening houden  met de t-verdeling

Zo. Nou is iedereen weer bijgepraat.....

Maar stel nou dat we om de één of andere reden niet geďnteresseerd zijn in μ, maar in de grootte van σ zélf!
De vraag is dan:  "Hoe ligt onze schatting s verdeeld rondom de ware σ?"

In zulke gevallen introduceren we een nieuwe variabele
  χ2  (spreek uit: Chi-kwadraat)  door:  χ2  = s˛/σ˛  
Daarmee verandert de vraag in:

Hoe ligt  χ2 verdeeld rondom 1?

       
Nou, gelukkig is die verdeling van χ2 bekend. Het is die draak van een formule hiernaast (daarin is overigens  ν = n - 1 = aantal vrijheidsgraden gebruikt).

Hieronder zie je er een aantal getekend  (afhankelijk van ν).

 

       
Je ziet dat de verdelingen alleen bestaan voor positieve waarden  (logisch want χ2 is nou eenmaal een kwadraat). Verder valt op dat de verdelingen vooral bij kleinere ν rechtsscheef zijn, maar voor grotere n steeds meer gaan lijken op een normale verdeling.

En op dezelfde manier als we deden bij de t-verdeling zijn er ook nu χ2-tabellen te maken met de grenswaarden bij de verschillende betrouwbaarheden: 
       
 

kans

n 0,995 0,99 0,975 0,95 0,90   0,10 0,05 0,025 0,01 0,005
2
3
4
5
0,000039
0,00501
0,0239
0,0517
0,00016
0,0101
0,0383
0,0743
0,00098
0,0253
0,0719
0,121
0,0039
0,0513
0,117
0,178
0,0158
0,1054
0,195
0,266
2,71
2,30
2,08
1,94
3,84
3,00
2,60
2,37
5,02
3,69
3,12
2,79
6,63
4,61
3,78
3,32
7,88
5,30
4,28
3,72
6
7
8
9
10
0,0823
0,113
0,141
0,168
0,193
0,111
0,145
0,177
0,206
0,232
0,166
0,206
0,241
0,272
0,300
0,229
0,273
0,310
0,342
0,369
0,322
0,367
0,405
0,436
0,463
1,85
1,77
1,72
1,67
1,63
2,21
2,10
2,01
1,94
1,88
2,57
2,41
2,29
2,19
2,11
3,02
2,80
2,64
2,51
2,41
3,35
3,09
2,90
2,74
2,62
11
12
13
14
15
0,216
0,237
0,256
0,274
0,291
0,256
0,278
0,298
0,316
0,333
0,325
0,347
0,367
0,385
0,402
0,394
0,416
0,435
0,453
0,469
0,487
0,507
0,525
0,542
0,556
1,60
1,57
1,55
1,52
1,50
1,83
1,79
1,75
1,72
1,69
2,05
1,99
1,94
1,90
1,87
2,32
2,25
2,18
2,13
2,08
2,52
2,43
2,36
2,29
2,24
16
17
19
21
25
0,307
0,321
0,348
0,372
0,412
0,349
0,363
0,390
0,413
0,452
0,417
0,432
0,457
0,480
0,517
0,484
0,498
0,522
0,543
0,577
0,570
0,582
0,604
0,622
0,652
1,49
1,47
1,44
1,42
1,38
1,67
1,64
1,60
1,57
1,52
1,83
1,80
1,75
1,71
1,64
2,04
2,00
1,93
1,88
1,79
2,19
2,14
2,06
2,00
1,90
31
41
61
121
0,460
0,518
0,592
0,699
0,498
0,554
0,625
0,724
0,560
0,611
0,675
0,763
0,616
0,663
0,720
0,798
0,687
0,726
0,774
0,839
1,34
1,30
1,24
1,17
1,46
1,39
1,32
1,22
1,57
1,48
1,39
1,27
1,70
1,59
1,47
1,32
1,79
1,67
1,53
1,36
1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000
       
Voorbeeld.
Neem een steekproef van 15 exemplaren waarin je een  s2  van 8,6 vindt.
Voor de 95%-betrouwbaarheidsintervallen geeft de tabel bij  0,025 en 0,975 de twee kritieke punten  1,87 en 0,402
χ2 = 1,87 geeft  
s˛/σ˛ = 1,87   dus  σ28,6/1,87 = 4,6
χ2 = 0,402 geeft  
s˛/σ˛ = 0,402   dus  σ28,6/0,402 = 21,4
Het betrouwbaarheidsinterval voor σ2  is dus  [4.6,  21.4]
       
   OPGAVEN
       
1. Maak 95%-betrouwbaarheidsintervallen voor de variantie van de hele populatie in het geval van de volgende steekproeven:
       
  a. Bij een steekproef van 16 mensen wordt een IQ gemeten, waarvoor geldt  s2 = 84
     

[45.9 , 201.4]

  b. Een machine produceert schroeven. Een meting van  25 schroeven levert voor de lengte van die schroeven een standaarddeviatie op van  0,08 mm.
     
[0.0039 , 0,0124]
  c. Een arts meet bij 8 proefpersonen de hartslag en vindt een standaarddeviatie van  8,2.
     

[29.4 , 279.0]

       
     

© h.hofstede (h.hofstede@hogeland.nl)