|
|||||||||||||||||
Naast mooie plaatjes
maken willen wij als wiskundigen ook graag metingen samenvatten in
getallen. Bij een frequentieverdeling (tabel, histogram, polygoon enz.)
vinden we in het algemeen twee dingen interessant. Op de eerste plaats willen we graag weten waar het midden van de metingen zit. Dat geeft immers aan hoe groot de metingen ongeveer zijn. Op de tweede plaats willen we weten hoe ver de metingen zo'n beetje van dat midden afliggen. Ofwel: hoe ver de metingen uit elkaar liggen; hoe groot de spreiding in de metingen is. Om het "MIDDEN" van een serie metingen aan te geven zijn er drie mogelijke manieren. Die heten de centrummaten en we zullen ze één voor één bespreken. |
|||||||||||||||||
1. Het Gemiddelde. Nou, die kent iedereen natuurlijk wel. Gewoon alle getallen optellen en dan delen door hoeveel het er waren. Bij een klassenindeling dan doe je gewoon alsof alle metingen in een klasse gelijk zijn aan het klassenmidden (kijk goed uit wát dat klassenmidden is!). Je krijgt dan een schatting voor het gemiddelde, het werkelijke gemiddelde is niet precies bekend natuurlijk, want je weet niet hoe de metingen wérkelijk over de klassen verdeeld waren. Het teken dat we gebruiken voor het gemiddelde is een x met een streepje erboven. voorbeeld 1. |
|||||||||||||||||
|
|||||||||||||||||
Rechts zie je nog wat je je zo'n beetje voor kunt stellen bij het gemiddelde. Als je histogram gemaakt zou zijn van houten blokken is het gemiddelde het punt ten opzichte waarvan het hele histogram in evenwicht is. | |||||||||||||||||
2. De Mediaan. | |||||||||||||||||
De mediaan is gewoon het
middelste getal van al je metingen. Daarvoor moet je ze dus wel eerst op volgorde van klein naar groot zetten. Denk er goed om dat het middelste van 10 getallen niet nummer 5 is!!! Die middelste zit tussen nummer 5 en nummer 6 in. In zo'n geval nemen we als mediaan het gemiddelde van de twee getallen waartussen het middelste getal zit. Bij n getallen is de mediaan nummer (n + 1)/2 Het is in het histogram dus het punt vanwaar de oppervlakte aan beide kanten gelijk is, voorbeeld 2. Wat is de mediaan van de getallen 3 - 3 - 4 - 4 - 4 - 4 - 5 - 6 - 6 - 7 - 8 - 8 - 10 - 10 - 10 - 10 - 10 - 14 ? Er staan hier 18 getallen op volgorde. De middelste daarvan ligt tussen nummer 9 en nummer 10. Nummer 9 is 6, en nummer 10 is 7, dus de mediaan is 6,5. Mediaan bij klassenindeling. Als je te maken hebt met een klassenindeling, en een continue variabele, dan doe je alsof al je waarnemingen gelijkmatig over de klassen verdeeld zijn. Voorbeeld 3. |
|||||||||||||||||
Bepaal de mediaan
van de verdeling hiernaast. de mediaan is de middelste van 63 getallen, dus nummer 32. Die zit ergens in de klasse 24-<36, maar dichter bij 36 dan bij 24. Waar precies kun je het beste zien in het cumulatieve frequentiepolygoon. Als we daarin inzoomen op de klasse 24 -<36 dan zien we dit:
|
|
||||||||||||||||
De
zwarte stippen staan bij de rechter klassengrenzen. Door te interpoleren
kunnen we waarde van de rode vraagtekens vinden: • van 14 naar 32 is 18 van de totale klassenbreedte 22, dus dat is 18/22 ste deel. • dan is van 24 tot de rode vraagtekens ook 18/22 van de totale breedte 12, en dat is 9,8 • de mediaan is daarom 24 + 9,8 = 33,8. N.B. Bij een oneven aantal discrete getallen is de Mediaan de middelste daarvan. Bij het berekenen van het 1e en het 2e kwartiel tel je die mediaan NIET meer mee voor de aantallen van beide helften. Als er bijvoorbeeld 15 getallen zijn, is de mediaan nummer 8 De linkerhelft zijn dan 7 getallen dus het eerste kwartiel is nummer 4. |
|||||||||||||||||
3. De Modus. | |||||||||||||||||
De modus is de meest voorkomende
meetwaarde, ofwel gewoon het hoogste staafje in het histogram. Als het om een hele klasse gaat, dan spreken we niet van modus maar van modale klasse. Als er meerdere metingen of klassen samen de hoogste frequentie hebben, dan is er geen modus of modale klasse aan te wijzen. In voorbeeld 1 hierboven is de modale klasse [26, 34], en in voorbeeld 2 is de modus 10, en in voorbeeld 3 is de modale klasse 24 -<36. |
|||||||||||||||||
Hier zie je nog in één plaatje de drie centrummaten bij één histogram: | |||||||||||||||||
|
|||||||||||||||||
|
|||||||||||||||||
|
|||||||||||||||||
Voor- en Nadelen. Het gemiddelde lijkt een erg betrouwbare en precieze maat voor het midden, maar soms valt dat tegen. Dat is vooral zo als er sprake is van uitschieters. |
|||||||||||||||||
Neem bijvoorbeeld het histogram hiernaast.
Daar zie je dat, als er één meetwaarde verandert, ook meteen het
gemiddelde mee gaat veranderen, terwijl modus en mediaan gelijk blijven. De mediaan is veel stabieler. Eén extra meting of één foute meting zal de mediaan nooit veel kunnen laten verschuiven. Behalve misschien in een verdeling als hieronder, daar verspringt de mediaan ineens als er rechts één meetwaarde bijkomt. Maar goed, dat is wel érg toevallig natuurlijk! |
|||||||||||||||||
|
|||||||||||||||||
De modus is ook vaak redelijk onbetrouwbaar. Als er meerdere meetwaarden zijn die ver van elkaar af liggen, maar ongeveer even vaak voorkomen, dan kan de modus maar zo van de één naar de ander springen. | |||||||||||||||||
Vooral bij verdelingen met één waarde die
verreweg het meest voorkomt is de modus wél een redelijk stabiel getal.
Een heel bekend voorbeeld is het modale inkomen. Hiernaast zie je dat dat in Nederland in 2008 ongeveer €16000- €18000 was. Maar omdat deze verdeling rechtsscheef is, zal dat beslist niet gelijk zijn aan het gemiddelde inkomen. Een mooie animatie hiervan is te zien op: http://www.cbs.nl/nl-NL/menu/themas/inkomen-bestedingen/cijfers/extra/2008-inkomensverdeling.htm
|
|
||||||||||||||||
Met de TI-83 | |||||||||||||||||
Met de TI-83 kun je gemiddelde en mediaan als
volgt bepalen. Voer eerst je frequentietabel in via STAT - EDIT zoals je al gewend was (klassenmiddens bij L1, frequenties bij L2). Gebruik dan STAT - CALC - 1: 1-Var Stats Toets daarachter in ( L1 , L2 ) Dan krijg je het scherm hiernaast en kun je het gemiddelde (x) en de mediaan (Med) aflezen. In dit geval was het gemiddelde gelijk aan 20,36 en de mediaan was 20. De modus kun je niet vinden op de TI, maar die is dan ook wel érg makkelijk direct uit je tabel af te lezen!!! |
|
||||||||||||||||
|
|||||||||||||||||
© h.hofstede (h.hofstede@hogeland.nl) |
|||||||||||||||||