|
|
Meerdere metingen. |
©
h.hofstede (h.hofstede@hogeland.nl) |
|
|
|
Voor
een gezonde visstand is het nodig dat er tenminste 5 mg zuurstof per
liter water aanwezig is.
Stel je voor dat ik mij zorgen maak over de waterkwaliteit van de sloten
in Groningen.
Het natuurbeheer van Groningen beweert dat er gemiddeld 5,2 mg zuurstof
per liter water aanwezig is (met een standaarddeviatie van 1,3), maar ik
denk dat dat minder is.
Dan kan ik besluiten dat te gaan controleren. Gewoon nameten dus. Het is
natuurlijk niet erg wetenschappelijk om dan maar in één sloot ergens één
watermonster te nemen en naar aanleiding van de éne meting conclusies te
gaan trekken.
Het lijkt veel logischer om een groot aantal monsters uit verschillende
sloten te halen, en naar aanleiding van het gemiddelde zuurstofgehalte
in die monsters mijn vermoeden te toetsen.
Hoe verandert daardoor het
toetsmodel?
Bij het nemen van één monster zou het model er zó uitzien: |
|
|
H0:
μ =
5,2 met σ = 1,3
H1: μ < 5,2
|
|
|
|
Wat wordt er anders aan dit model
als ik niet één meting doe, maar bijvoorbeeld het gemiddelde van 40
metingen neem?
Je moet je afvragen: |
Wat zegt H0 over het gemiddelde van
40 metingen? |
|
Ofwel: als iets normaal
verdeeld is met (μ = 5,2 met
σ = 1,3)
hoe is het dan met het
gemiddelde van 40 metingen?
Nou, dat hebben we al gehad toen we bespraken hoe het gemiddelde en de
standaarddeviatie veranderen als je van dingen het gemiddelde neemt of
dingen bij elkaar optelt. Dat stond in
deze les, en de
conclusie daar was: |
|
|
n dingen
optellen:
μsom =
nμ1
en σsom=
σ√n
gemiddelde van n dingen nemen:
μgem =
μ en
σgem =
σ/√n |
|
|
|
Voor dit model zou dat de nieuwe
H0 geven: μ = 5,2
en σ = 1,3/√40
≈ 0,206
Als we een significantieniveau van 0.05 nemen, en ik zou als gemiddelde
zuurstofgehalte van 40 sloten 4,7 mg/liter gemeten hebben, dan is de
overschrijdingskans daarbij: normalcdf(0, 4.7, 5.2, 0.206) = 0,008
en dat is veel kleiner dan 0,05 dus mag ik concluderen dat die 5,2 mg/l
die men beweert niet klopt.
Merk nog op dat als ik bij één meting 4,7 zou vinden, de
overschrijdingskans gelijk was aan
normalcdf(0, 4.7, 5.2, 1.3) = 0,35. Dat is lang niet genoeg om H0
te mogen verwerpen.
Ik hoop dat je dat logisch vindt: aan de hand van 40 metingen is het
uiteraard eerder toegestaan iets te beweren dan aan de hand van één
meting. Dat van die 40 is natuurlijk veel betrouwbaarder.
conclusie: |
|
|
Als niet één meting is gedaan:
H0 aanpassen!!!
(Verder blijft alles hetzelfde) |
|
|
|
praktische opmerking.
In veel praktische gevallen is wel een gemiddelde bekend,
maar geen standaarddeviatie. Vaak wordt dan een schatting van de
standaarddeviatie gedaan door te berekenen wat de standaarddeviatie van
de steekproef is. Die is echter wel wat groter dan de "echte"
standaarddeviatie van de hele populatie (binnen een klein aantal
metingen zit nou eenmaal meer willekeurige fluctuatie dan binnen een erg
groot aantal). De verdeling is dan niet meer normaal, maar heet een t-verdeling. |
|
|
OPGAVEN |
|
1. |
De spijbeltijd per leerling loopt op een
middelbare school nogal uit de hand. Op een bepaald moment is
dat zelfs 3,4 uur per leerling per week (met een
standaarddeviatie van 0,8 uur).
Men besloot tot een strenger controlebeleid en strafbeleid over
te gaan.
Na een korte aanloopperiode bleek bij een test van 30 leerlingen
de gemiddelde spijbeltijd gelijk te zijn aan 2,9 uur.
Mag men hieruit concluderen (neem α
= 0,05) dat de gemiddelde spijbeltijd per leerling per week
inderdaad korter is geworden? |
|
|
2. |
De levensduur van spaarlampen hoort normaal
verdeeld te zijn met een gemiddelde van 5000 uur en een
standaarddeviatie van 600 uur.
Een steekproef van 300 lampen van een bepaalde fabrikant blijkt
echter een gemiddelde levensduur van 4950 uur.
Mag men daaruit concluderen dat de fabrikant inferieure
spaarlampen levert? Neem een significantieniveau van 10%. |
|
|
3. |
De firma BonFire
verkoopt houtskool in verpakkingen van 5 kilogram met een
standaarddeviatie van 0,2 kg.
Een kritisch koper meet dat het gemiddelde gewicht van een groot
aantal zakken gelijk is aan 4930 gram.
Hij laat wiskundig zien dat hij aan de hand van deze meting mag
concluderen dat de firma BonFire minder dan 5 kg in de zakken
stopt (met een significantieniveau van 5%)
Hoeveel zakken heeft de kritische koper minstens gewogen? |
|
|
|
4. |
De supermarkt ALDI beweert dat alle caissières
net zolang getraind worden totdat ze een gemiddelde
afhandelingtijd aan de kassa van 2 minuten per klant bereiken
(met een standaarddeviatie van 0,5 minuut).
Ik geloof daar niets van, want laatst was ik bij de ALDI en toen
waren er 5 mensen voor me in de rij, maar moest ik maar liefst
12 minuten wachten voordat ik aan de beurt was.
Mag ik naar aanleiding hiervan inderdaad concluderen dat dat
gemiddelde van 2 minuten per klant in werkelijkheid hoger is?
(neem een significantieniveau van 5%). |
|
|
|
|
5. |
Een pompoenenkweker kan een grote voorraad van
2000 pompoenen verkopen aan een veiling. Hij krijgt van de
veiling een bedrag per pompoen dat afhankelijk is van het
gewicht van de pompoen. Hoe zwaarder, des te meer geld.
De veiling deelt aangeleverde pompoenen in drie categorieën in,
en betaalt daarvoor het volgende: |
|
|
|
|
|
gewicht |
0 - 2 kg |
2 - 4 kg |
meer dan 4 kg |
opbrengst |
€0,20 |
€0,30 |
€0,45 |
|
|
|
|
|
|
De kweker beweert dat het gewicht
van zijn pompoenen normaal verdeeld is met een gemiddelde van
2,8 kg en een standaarddeviatie van 0,5 kg. De
veilinginkoper vertrouwt de zaak niet en neemt een steekproef
van 10 pompoenen uit de voorraad. Die wegen gemiddeld slechts
2,5 kg. Hij concludeert dat de pompoenen minder wegen. |
|
|
|
|
|
|
a. |
Toon aan dat de veilinginkoper dat
inderdaad bij een significantieniveau van 5% mag concluderen. |
|
|
|
|
|
De veilinginkoper stelt daarom voor
de kweker te betalen voor een voorraad met een gemiddelde van
2,5 kg en een standaarddeviatie van 0,5 kg.
Maar de kweker beweert nu dat hij zich vergist heeft: het
gemiddelde was inderdaad wél 2,8 kg maar de standaarddeviatie
was 0,58 kg. |
|
|
|
|
|
b. |
Toon aan dat de inkoper die bewering
aan de hand van zijn meting niet mag verwerpen. |
|
|
|
|
|
c. |
Bereken hoeveel geld de kweker in
beide gevallen voor zijn voorraad krijgt. Rond af op hele euro's |
|
|
|
|
6. |
Een tablet Aspirine-C van de firma
Bayer bevat 400 mg acetylsalicylzuur (acetosal) en 240 mg
ascorbinezuur (vitamine C) per tablet. Tenminste dat staat erop.
Die eerste stof is de werkzame stof die pijnverlichting geeft.
Het blijkt dat de werkelijke hoeveelheid acetylsalicylzuur in
een tablet normaal verdeeld is met een gemiddelde van 400 mg en
een standaarddeviatie van 12 mg.
Als de hoeveelheid in een tablet minder dan 380 mg wordt, dan
werkt het niet goed meer. |
|
|
|
|
|
a. |
Hoe groot is de kans dat een
willekeurig gekozen tablet niet goed werkt? |
|
|
|
|
|
Uiteraard wordt regelmatig
gecontroleerd of de gemiddelde hoeveelheid acetylsalicylzuur in
een tablet wel 400 mg is.
Een steekproef van 100 tabletten leverde een gemiddelde
hoeveelheid acetylsalicylzuur op van 397,5 mg. |
|
|
|
|
|
b. |
Mag hieruit met een
significantieniveau van 5% worden geconcludeerd dat het
gemiddelde inderdaad minder is dan 400 mg? |
|
|
|
|
7. |
Ik wil graag een enorme houten vloer
van maar liefst 90m2 in de was gaan
zetten.
Ik kies voor het product Osmo Waxolie, dat wordt verkocht in
blikken waar op staat vermeld dat je met de inhoud van zo'n blik
16 m2 kunt behandelen. De standaarddeviatie daarvan
is 2 m2 .
Ik besluit daarom om 6 blikken te kopen, maar wat blijkt: ik heb
nét niet voldoende!!
Mag ik (met significantieniveau 5%) concluderen dat die beloofde
16 m2 op het blik lager is? |
|
|
|
|
|
|
|
|
8. |
Bij de
help-desk van een internetprovider worden de bellers
geholpen, waarbij de gemiddelde gesprekstijd gelijk is aan
6 minuten met een standaarddeviatie van 50 seconden. Het blijkt
dat dat te lang is, want er ontstaan te grote rijen wachtenden.
Men kan natuurlijk meer medewerkers aannemen zodat meer lijnen
tegelijk open zijn, maar men wil eerst proberen of het niet
mogelijk is de huidige medewerkers efficiënter te laten werken.
Daarom stuurt men iedereen op een cursus "helpdeskefficiëntie".
Na afloop blijkt de gemiddelde gesprekstijd van 40 gesprekken
gelijk te zijn aan 5 minuten en 51 seconden. |
|
|
|
|
a. |
Mag men
daaruit met 95% significantieniveau concluderen dat de cursus
heeft geholpen? |
|
|
|
|
|
b. |
Bij
welke aantallen gesprekken in de steekproef zou men bij een
gemiddelde van 5 minuten en 51 seconden wel mogen
concluderen dat de gemiddelde gesprekstijd is afgenomen? |
|
|
|
|
|
|
|
|
|
|
|
|
9. |
De
mentor van klas 3A beweert dat leerlingen tegenwoordig veel te
veel tijd met computerspelletjes doorbrengen. Volgens hem is
voor derdeklassers van tegenwoordig de gemiddelde computertijd
per dag normaal verdeeld met een gemiddelde van 200 minuten en
een standaarddeviatie van 30 minuten.
Een enquête onder 14 van zijn leerlingen leverde de volgende
computertijden op (in minuten): |
|
|
|
|
|
180 |
230 |
50 |
300 |
160 |
160 |
100 |
80 |
230 |
200 |
190 |
250 |
400 |
90 |
|
|
|
|
|
|
Is er
bij significantieniveau van 10% aanleiding om zijn bewering in
twijfel te trekken? |
|
|
|
|
|
|
|
|
10. |
Door de
aanvoer van zware metalen via kunstmest en dierlijke mest vindt
nagenoeg in alle landbouwgebieden ophoping van zware metalen in
de bodem plaats. Een normale hoeveelheid zink in onze bodem is
bijvoorbeeld 40 μmol/gram
droge bodem, met een standaarddeviatie van 6 μmol/gram.
Een ambtenaar van de milieudienst neemt bij een boerderij een
aantal bodemmonsters en meet daarin het zinkgehalte. Hij vindt
de volgende waarden: |
|
|
|
|
|
42 |
50 |
35 |
38 |
34 |
49 |
46 |
37 |
40 |
51 |
|
|
|
|
|
|
Mag hij
uit deze metingen concluderen dat het zinkgehalte in deze bodem
hoger is dan 40 μmol/gram?
Neem een significantieniveau van 5%. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
©
h.hofstede (h.hofstede@hogeland.nl) |
|