|
© h.hofstede (h.hofstede@hogeland.nl)
|
|
|
Spreidingsbreedte en Kwartielafstand. |
|
|
|
|
In een eerde les
hebben we van een frequentieverdeling de centrummaten bekeken. Dat waren
drie getallen (modus. mediaan en gemiddelde) die aangaven waar het
midden van de verdeling ligt.
Maar het midden van een verdeling zegt natuurlijk lang niet alles. Kijk
naar de histogrammen hieronder. Die hebben allemaal hetzelfde aantal
metingen en dezelfde mediaan en gemiddelde. (Degenen waar de modus
bestaat hebben ook nog eens dezelfde modus).Toch zijn ze nogal
verschillend, vind je niet? |
|
|
|
|
|
|
|
|
|
Waar zit hem nou dat verschil in?
Het "midden" van deze verdelingen zit wel steeds op dezelfde plaats,
maar de spreiding eromheen is nogal verschillend. De
eerste drie hebben nog wel ongeveer dezelfde "vorm", maar de breedte is
enorm verschillend. De vierde heeft een heel andere vorm.
Er zijn verschillende manieren om de spreiding van een verdeling in een
getal uit te drukken. |
|
|
|
|
1. De spreidingsbreedte. |
|
|
|
|
De spreidingsbreedte is de allereenvoudigste.
Het is gewoon de breedte van het histogram, ofwel de grootste meting min
de kleinste.
Een voordeel is dat het zo'n makkelijk te berekenen getal is. Een groot
nadeel is echter, dat deze breedte nogal gevoelig is voor één kleine
afwijking. Neem het histogram in de volgende twee figuren: |
|
|
|
|
|
|
|
|
|
Doordat er in die
rechterfiguur één metinkje bij is gekomen (duidelijk een
uitschieter) is de spreidingsbreedte nogal spectaculair veel veranderd,
terwijl de rest van de figuur toch gelijk is. |
|
|
|
|
2. De kwartielafstand. |
|
|
|
|
Om dit laatste probleem op te
vangen, en zo'n paar kleine getallen aan de rand niet teveel invloed te
laten hebben, kunnen we afspreken om de buitenste getallen niet mee te
laten tellen. |
|
|
|
|
Je zou bijvoorbeeld kunnen afspreken om
alleen het middelste deel van de figuur te nemen, bijvoorbeeld de
middelste 50% van de metingen.
Verdeel je getallen in vier gelijke delen
(dat wil zeggen evenveel metingen in elk deel, dus 25% van je metingen) en neem dan de breedte
van de middelste twee stukken.
De grenzen waar 25%, 50% en 75% van je metingen geweest zijn heten de
kwartielen Q1, Q2 en Q3.
Overigens kennen wij dat tweede kwartiel Q2 ook al onder de
naam mediaan (het is immers waar de helft
van je metingen geweest is?) |
|
|
|
|
|
Je kunt het eerste
kwartiel dus vinden door eerst de mediaan te berekenen.
Die mediaan verdeelt je metingen dan in twee groepen (Als de mediaan één
getal is, telt dat niet meer mee, als de mediaan tussen twee getallen in
ligt tellen beiden in een groep mee).
Als je nu de mediaan van de eerste groep berekent dan heb je het eerste
kwartiel Q1 gevonden.
De mediaan van de tweede groep geeft dan het derde kwartiel Q3. |
|
Voorbeeld.
Neem deze frequentietabel: |
|
meting |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
frequentie |
3 |
5 |
8 |
9 |
18 |
20 |
15 |
8 |
6 |
6 |
3 |
|
|
|
Daar staan 101
metingen (tel de frequenties maar op), dus de middelste is nr. 51
De mediaan is nr. 51 en dat is meting van Q2 =
9
Er zijn nu twee groepen van 50 en de middelste van zo'n groep ligt
tussen nummers 25 en 26 in die groep
De mediaan van de eerste groep is nr. 25-26 dat is tussen 7
en 8 dus Q1 is 7,5
De mediaan van de tweede groep is nr. 25-26 gerekend vanaf de
mediaan nr. 51, dus dat is nr. 76-77.
Dat is beiden een meting van 10, dus Q3 = 10 |
|
|
|
|
|
Als maat voor de spreiding nemen we nu de
middelste helft, dus dat is de afstand tussen Q1 en Q3.
Zie de figuur hiernaast.
Dat noemen de kwartielafstand
(of ook wel de interkwartielafstand)
In ons rekenvoorbeeld zou de kwartielafstand gelijk zijn aan
10
- 7,5 = 2,5
Het gebruiken van de kwartielafstand als maat voor de breedte van de
figuur heeft als voordeel dat een paar losse metingen aan de rand deze
spreiding niet beïnvloeden. Maar het heeft uiteraard als nadeel dat de
"vorm" en grootte van de buitenste helft helemaal niet worden meegeteld. |
|
|
|
|
|
De kwartielafstand bij een
cumulatief frequentiepolygoon.
|
Als je een cumulatief
frequentiepolygoon hebt dan kun je daar in één keer de kwartielafstand
uit aflezen, vooral als de frequenties (op de y-as) in procenten
zijn gegeven. Omdat de kwartielen alle metingen in vier kwarten
verdelen weet je immers direct:
Q1 vind je bij 25% van de metingen.
Q2 vind je bij 50% van de metingen.
Q3 vind je bij 75% van de metingen.
Kik maar bij het cumulatieve frequentiepolygoon hiernaast hoe je
razendsnel die kwartielen en de kwartielafstand kunt aflezen. |
|
|
|
|
|
spreidingsbreedte = grootste
- kleinste
kwartielafstand = Q3 - Q1 |
|
|
|
|
|
|
|
OPGAVEN. |
|
|
|
|
1. |
Hiernaast staat een cumulatief
frequentiepolygoon van de leeftijden van alle leden van een
golfvereniging.
Bepaal met dit polygoon de kwartielafstand, de mediaan en de
modus van deze metingen. |
|
|
|
|
|
2. |
Examenopgave HAVO wiskunde A, 2022-II
Wanneer er een melding bij de
ambulance-meldkamer binnenkomt, moet men de mate
van urgentie van de melding vaststellen en zorgen voor de inzet van
een ambulance: een ambulancerit. De mate van urgentie kan zijn: |
|
- |
Hoge urgentie:
de benodigde zorg is spoedeisend en er is sprake van direct
levensgevaar voor de patiënt. We noemen dit een A1-rit. |
|
- |
Lage urgentie:
de benodigde zorg is spoedeisend, maar er is geen direct
levensgevaar voor de patiënt. We noemen dit een A2-rit. |
|
- |
Geen urgentie:
de benodigde zorg is niet spoedeisend. We noemen dit een B-rit. |
|
|
|
|
|
In de rest van
de opgave kijken we alleen naar A1-ritten en A2-ritten. Omdat er bij
A1-ritten sprake is van direct levensgevaar voor de patiënt, zijn de
responstijden van deze ritten over het algemeen korter dan de
responstijden van de A2-ritten.
In de figuur staan de relatieve cumulatieve frequentiepolygonen van
de responstijden van de A1-ritten en die van de responstijden van de
A2-ritten in 2014. In de figuur is niet aangegeven welke polygoon
bij de A1-ritten hoort en welke bij de A2-ritten. |
|
|
|
|
|
|
|
|
|
|
|
Bepaal met
behulp van de figuur de interkwartielafstand van de responstijd van
de A1-ritten. Geef hierbij aan welke polygoon je gebruikt hebt en
licht je keuze toe. |
|
|
|
|
3. |
Een
uitschieter is een meetwaarde die erg ver onder of boven
de rest van de meetwaarden ligt.
Men neemt in de statistiek meestal als vuistregel dat een meetwaarde die
meer dan 1,5 keer de kwartielafstand boven Q3 of onder Q1 ligt, als
uitschieter wordt beschouwd.
Een onderzoeker heeft de volgende meetwaarden gevonden:
12 - 32 - 34 - 38 - 40 - 41 - 45 - 51 - 52 - 54 - 55 - 55 - 58 - 62 - 65
- 70 - 94
Onderzoek of de meetwaarden 12 en 94 volgens de vuistregel hierboven
uitschieters zijn. |
|
|
|
© h.hofstede (h.hofstede@hogeland.nl)
|