Eén- en Tweezijdige toetsen.

© h.hofstede (h.hofstede@hogeland.nl)

   
(in het vervolg wordt met H0 en H1 soms de personen en soms hun beweringen bedoeld).

De vorige les bekeken we het volgende toetsmodel:
 
H0p = ....
H1p > ...  of   p < ....
   
H0 was degene die iets over een kans beweerde, H1 degene die beweerde dat die kans groter of kleiner was.
Maar het kan natuurlijk ook dat H1 beweert dat die kans NIET gelijk is aan p.
Dus zonder te zeggen of de kans groter of kleiner is.
Eigenlijk beweert hij alleen maar  "NIETES!"

Wat zijn de gevolgen voor het model?

Het nieuwe model wordt in zo'n geval:
   
H0p = ....
H1p ≠ ....
   
Het enige verschil met het vorige toetsmodel is, dat H1 nu gelijk krijgt als de meting straks heel ver aan de linkerkant óf heel ver aan de rechterkant van het midden van de H0-verdeling  terechtkomt. Dus bij een meting in één van beide rode gebieden in de schets hiernaast krijgt H1 gelijk (terwijl hij dat niet heeft!).

Omdat de kans op een foute conclusie gelijk is aan het significantieniveau α, geldt dus in dit geval dat beide rode gebieden samen kans α hebben.

Alhoewel de figuur niet symmetrisch hoeft te zijn (is íe alleen bij p = 0,5) kiezen we toch de grenzen G1 en G2 zó dat aan beide buitenkanten een oppervlakte 0,5α zit.
De toets heet in zo'n geval Tweezijdig.

   
tweezijdige toets     beide kanten 1/2α
   
Voorbeeld.

Bioloog  A beweert dat de kans op roodharigheid niet geslachtsgebonden is. Zijn collega bioloog B beweert dat dat wél zo is. Van de 200 gevonden roodharigen bleek 113 vrouw te zijn en 87 man.
Wie krijgt er met een significantieniveau van 5% gelijk naar aanleiding van deze gegevens?

Noem succes:  "een roodharige is een vrouw"
H0 (bioloog A):  p = 0,5   en  H1:  p 0,5
De meting gaf  113 successen van de 200.
De overschrijdingskans is 1 - binomcdf(200, 0.5, 112) = 0,038
Dat is groter dan 1/2α (= 0,025)  dus H0 wordt aangenomen.

N.B.
Merk nog op, dat als bioloog B had beweerd dat vrouwen vaker roodharig zijn dan mannen, dat dan de toets éénzijdig was geworden, en dat H0 dan was verworpen!
   
   
  OPGAVEN
   
1. Als je een punaise op tafel laat vallen dan kan hij op twee manieren komen te liggen:
       
 

       
  Volgens een statisticus A is de kans dat op beide mogelijkheden gelijk, maar volgens zijn collega B is dat niet zo.
Ze gooien een heel doosje met 128 punaises op tafel en tellen hoeveel er met de punt omhoog liggen.
Dat blijken er 54 te zijn.
       
  a. Wie krijgt gelijk bij een significantieniveau van 5%?  
       
  b. Bij welke significantieniveaus krijgt collega B gelijk naar aanleiding van deze zelfde meting?
     

α > 9,2%

       
2. Een fabrikant van dobbelstenen beweert dat zijn stenen "zuiver" zijn, dat betekent dat elk aantal ogen een even grote kans heeft om voor te komen. Een Casino dat een grote afnemer van dobbelstenen is, beweert dat door fluctuaties in de dichtheid van het materiaal de geproduceerde stenen niet zuiver zijn.
Men besluit een dobbelsteen van deze fabrikant 1200 keer te gooien en te kijken hoeveel vieren daarbij gegooid worden.

Dat bleken er 224 te zijn.

Mag men naar aanleiding van deze meting met 10% betrouwbaarheid concluderen dat de dobbelstenen inderdaad niet zuiver zijn?
     

 JA

       
3. Volgens een numerologe heeft elk mens (meestal onbewust) één speciaal cijfer (0 tm 9) waar hij/zij zich meer door aangetrokken voelt. Dat betekent dat een testpersoon die gevraagd wordt een groot aantal willekeurige cijfers te noemen, één cijfer vaker zal noemen dan de anderen (en al die anderen dus automatisch minder vaak).
Ik ben het daar als wiskundige niet mee eens, volgens mij is dat lariekoek. Ik denk dat alle cijfers die zo'n testpersoon noemt een even grote kans hebben om voor te komen.

Wij besluiten tot een toets, en vragen een testpersoon om 300 willekeurige cijfers te noemen. We tellen het aantal vijven dat de persoon noemt, en dat zijn er 20.
       
  a. Wat is de conclusie bij een significantieniveau van 95%?  
       
  b. We hadden natuurlijk ook kunnen kijken welk cijfer de testpersoon het vaakst noemt. Stel dat dat een acht was en dat de testpersoon die 40 keer noemde. Wat zou dan de conclusie zijn met α = 0,05?
       
4. Er gaat een hardnekkig  gerucht dat de kans op doofheid bij een kat te maken heeft met de kleur van de ogen, maar volgens mij is dat niet waar.

Nou is bekend dat in totaal 30% van alle katten blauwe ogen heeft.

Een onderzoek onder 100 dove katten leverde op dat daarvan 39 katten blauwe ogen hadden.

       
  a. Wat moet ik aan de hand van deze gegevens met α = 0,05 concluderen?
       
  b. Wat zal iemand die beweert dat katten met blauwe ogen vaker doof zijn dan andere katten aan de hand van deze gegevens met α = 0,05 concluderen?
       
5. Een casino probeert natuurlijk de roulettetafels goed horizontaal neer te zetten, en perfect af te stellen,  zodat de kans op elke uitkomst gelijk is. Het balletje zal dan op elk van de getallen 0 tm 36 vallen met een even grote kans.
Een professioneel gokker beweert dat dat de casino's nooit lukt dus dat er altijd uitkomsten zijn die vaker of minder vaak dan gemiddeld voorkomen. Door dat allemaal bij te houden kan hij namelijk geld verdienen!

Men besluit tot een weddenschap (hoe kan  het ook anders?), waarbij men het balletje 2500 keer laat vallen, en bijhoudt hoe vaak het getal 0 voorkomt. Men gebruikt een significantieniveau van 5%

Bij hoeveel nullen zal de professionele gokker gelijk krijgen?

     

84 of  51

6. In ons land heeft 30% van de middelbare scholieren last van acne. Onderzoekers vermoeden dat dat wel eens te maken kon hebben met het contact van de huid met zwemwater waar chloor in zit.
Men onderzoekt  548 scholieren die géén zwemdiploma hebben en dus weinig in contact zijn geweest met zwemwater.
Bij hoeveel gevallen van acne onder deze 548 scholieren kan men concluderen dat contact met zwemwater inderdaad de kans op acne vergroot? Neem een significantieniveau van 5%.
     

146 of minder

7. Een groentekweker kweekt vooral komkommers. De lengte van de komkommers is normaal verdeeld met een gemiddelde van 36 cm en een standaarddeviatie van 4 cm. Komkommers die korter zijn dan 30 cm zijn niet geschikt voor de verkoop, maar worden vermalen.   
       
  a. Toon aan dat de kans dat een komkommer wordt  vermalen gelijk is aan 0,067
       
  Een bioloog beweert dat door gebruik van CO2 in de kassen de lengte van de komkommers toeneemt. Van de 1200 komkommers die behandeld worden met CO2 hoeven er nog maar 68 te worden vermalen.
       
  b. Is er daarmee met een significantieniveau van 5% aangetoond dat de CO2 behandeling inderdaad de lengte vergroot?
       
8. Het tentamen "Statistiek I"  is voor eerstejaars psychologiestudenten elke keer een groot struikelblok. Het blijkt dat de afgelopen jaren slechts 15% van de studenten ervoor slaagt.
       
  a Bereken dan de kans dat van de 250 studenten die meedoen aan zo'n examen er minstens 50 slagen.
       
  Dit jaar heeft men het anders aangepakt: er is een nieuw systeem van lesgeven ingevoerd, met minder hoorcolleges meer werkcolleges. Er zijn dit jaar 320 eerstejaarsstudenten die het tentamen allemaal zullen maken.
       
  b. Bij hoeveel geslaagden mag je concluderen dat het nieuwe onderwijssysteem een verbetering is?  Neem een significantieniveau van 5%.
       
     

© h.hofstede (h.hofstede@hogeland.nl)