© h.hofstede (h.hofstede@hogeland.nl)

Klassenindeling
       
Neem de volgende tabel met de gewichtsgegevens van 60 kinderen uit groep 8 van een aantal basisscholen:
       
gewichten kinderen groep 8.
40,2 39,5 34,2 45,3 46,8 40,4 38,4 35,2 37,1 40,3
44,4 45,6 50,2 39,4 39,2 37,6 33,3 33,5 50,0 41,7
30,9 47,1 54,2 53,6 42,1 35,3 35,6 39,9 47,2 35,4
34,7 50,8 37,8 51,4 36,1 50,1 35,8 34,6 30,7 48,9
46,6 37,7 45,0 49,8 30,5 45,9 44,1 48,7 44,0 50,7
46,3 34,3 31,6 46,2 48,6 46,9 46,5 38,7 56,7 43,3
       
Het maken van een frequentietabel heeft nu niet zoveel zin!
Zie je waarom?
Elk gemeten getal komt maar één keer voor.  Dat betekent dat de frequentietabel precies hetzelfde wordt als de tabel hierboven. De gewichten staan dan wel netjes op volgorde, maar alle frequentie worden gelijk aan 1. Dat geeft geen winst.

In zo'n geval is het vaak handig om de gemeten gewichten in groepen bij elkaar te nemen. Dat heet een klassenindeling maken, en dat gaat bijvoorbeeld zó:
       
In de tabel hiernaast zijn de gewichten van 30-35 als één groep (een klasse) geteld, met zo als 35-40, 40-45 enz.

Toch zit er nu nog een onduidelijkheid in deze tabel.
Zie je welke?

Klassengrenzen.

Het is onduidelijk in welke klassen het getal 35 hoort. Is dat in de eerste of in de tweede klasse?  Onduidelijk!

Dat moet duidelijker!!!!
gewicht aantal
30-35 10
35-40 16
40-45 9
45-50 16
50-55 8
55-60 1

 

Je zult de grenzen beter moeten aangeven, en daar zijn twee methoden voor op de markt:

Methode 1:   Met  de notatie  - <
-
betekent  "tot kleiner dan".
30
- < 35  betekent dan:  "30 tot kleiner dan 35"  dus hoort 30 er wél bij, en 35 niet (35 is immers niet kleiner dan 35). In dat geval hoort 35 dus in de tweede klasse (35 - < 40)

Methode 2.   Gebruik de intervalnotatie
Bij de intervalnotatie  gebruiken we de haakjes  [   en   .
[   betekent dat het getal bij het haakje er WEL bijhoort.
〉   betekent dat het getal bij het haakje er NIET bijhoort.
Dus  [30,35ñ betekent dat 30 er nog bij hoort en 35 niet; die zit in de volgende klasse.

Als ezelsbruggetje om dit te onthouden moet je dat geknikte haakje gewoon zien als groen-zeep helling.
Die 35 links glijdt eruit, en die 35 rechts staat stevig op het randje en blijft erin!

       
De volgende twee frequentietabellen zijn dus wél goed, en ook in feite gelijk aan elkaar:
       

gewicht

aantal

30 - < 35 10
35 - < 40 16
40 - < 45 9
45 - < 50 16
50 - < 55 8
55 - < 60 1
           

gewicht

aantal

[30, 35〉 10
[35, 40〉 16
[40, 45〉 9
[45, 50〉 16
[50, 55〉 8
[55, 60〉 1
       
Berekening van het gemiddelde.
       
Daarover kunnen we kort zijn:
       
Doe alsof alle getallen van een klasse gelijk zijn aan het klassenmidden.
       
Voor de berekening van het gemiddelde doe je dus alsof de tabellen hierboven gelijk zijn aan de tabel hiernaast.

Invoeren in de GR:
L1 = 32,5 - 37,5 - 42,5 - 47,5 - .....
L2 = 10 - 16 - 9 - 16 - 8 - ....
CALC - 1Var Stats - ENTER  geeft een gemiddelde
van afgerond   x̅ = 42,4
Natuurlijk is dit slechts een schatting van het gemiddelde.
Je weet immers niet hoe die getallen verdeeld zijn over de klassen....
gewicht aantal
32,5 10
37,5 16
42,5 9
47,5 16
52,5 8
57,5 1
Je doet nu alsof die 10 getallen uit klasse [30, 35〉 allemaal gelijk zijn aan 32,5.  Toch zouden ze best alle 10 gelijk kunnen zijn aan 30. Dat zou wel heel toevallig zijn natuurlijk, maar niet onmogelijk.  Of allemaal 35, dat zou ook kunnen.
In het eerste "toevallige" geval zou het gemiddelde 2,5 lager worden en in het tweede geval juist 2,5 hoger.
Het enige dat we zeker weten is dat het gemiddelde tussen de  39,9  en  44,9 ligt
       
Absoluut en Relatief

Er is nog een andere manier om frequenties weer te geven, en dat is om niet de aantallen zélf te noemen, maar de procenten die ze van het totaal zijn. Als je dat doet, dan heet dat de Relatieve frequentie  (in tegenstelling tot de "echte" aantallen die we tot nu toe gebruikten; die heten ook wel de Absolute frequentie).
       

relatief  =  in procenten

       
Voor de berekeningen kun je gewoon doen alsof die procenten de echte aantallen zijn, dat maakt niks uit voor de antwoorden.
       
Histogrammen.
       
Als je eenmaal een frequentieverdeling met een klassenindeling hebt dan kun je daar makkelijk een histogram van maken.
Wat een histogram is weet je vast nog wel uit de onderbouw:  zo'n  "figuur met van die staafjes"
Een histogram van onze bovenstaande frequentieverdeling zou er uitzien als hiernaast. Er zijn maar een paar opmerkingen over te maken.
     
1. De frequentie staat altijd op de verticale as, wat er gemeten is staat op de horizontale as.
     
2. De staafjes staan tegen elkaar aan. De horizontale as heeft een continue verdeling.
Als dat niet zo is (bijvoorbeeld bij kwalitatieve variabelen) dan staan de staafjes los, en dan spreken we van een staafdiagram.
       
3. De staafjes zijn allemaal even breed.
       
4. Als je de breedte van de staafjes 1 noemt, dan is de oppervlakte van het histogram gelijk aan de totale frequentie. Als je gebruik maakt van relatieve frequenties (dus procenten op de verticale as) dan is de totale oppervlakte gelijk aan 100%.
       
5. Op de horizontale as is tussen 0 en 30 een zogenaamde "scheurlijn" getekend om aan te geven dat er een (leeg) stuk is weggelaten.
       
Leuke vondst...
       

Iemand moest van de tabel hieronder een staafdiagram maken, maar het lelijke aan een normaal staafdiagram hiervan is, dat die ene staaf van Amerika veel en veel langer is dan de andere vier.

 
land Duitsland Nederland Amerika Frankrijk Spanje
inwoners
(miljoenen)
82 16 307 64 47
 
Dat zou betekenen dat bij een mooi vierkant plaatje de hoogtes van de andere staven slechter af te lezen zouden zijn.
In de figuur hier rechtsonder zie je hoe de maker dat op een originele manier toch duidelijk wist te tekenen.
       

       
       
 
                                       
  OPGAVEN.
       
1. Teken bij onderstaande tabellen een staafdiagram of een histogram. Kies zelf welk van beiden het best past.
       
  a. Het aantal minuten per dag dat leerlingen uit een klas gemiddeld aan hun huiswerk besteden :
       
   
minuten 0 - 20 20 - 40 40 - 60 60 - 80 80 - 100 100 - 120
aantal 2 10 8 5 3 1
       
  b. Het aantal inwoners van de 6 grootste steden van Nederland op 1 januari 2008:
       
   
stad Amsterdam Rotterdam Den Haag Utrecht Eindhoven Almere
inwoners 743600 533910 475680 258520 210330 183270
       
  c. De lengteverdeling van een grote groep Nederlandse mannen in 2006:
       
   
lengte 150 -160 160 - 170 170 - 180 180 - 190 190 - 200 200 - 210 210 - 220
aantal 40 150 330 376 223 68 13
       
  d. Geef in de door jou getekende histogrammen het gemiddelde aan.
       
2. In onderstaand staafdiagram staat de jaaromzet van een bedrijfje uitgesplitst naar seizoen:
       

       
  a. Welk jaar was de omzet het grootst?
       
  b. Welk seizoen was over deze vier jaar in totaal de omzet het grootst?
       
  c. "Goh, dit seizoen is de omzet veel lager dan in hetzelfde seizoen vorig jaar" mompelt de bedrijfsleider teleurgesteld. Wanneer kan hij dat gemompeld hebben?
       
  d. In 2005 was de totale omzet gelijk aan  80000. In de lente, zomer, herfst  was de omzet allemaal gelijk, maar in de winter dubbel zo groot. Teken de omzet van 2005 in de figuur hierboven.
       
  Een wiskundige ziet dat het handig is om de jaren én de seizoenen direct met elkaar te kunnen vergelijken, en verzint daarom een driedimensionaal histogram.
Het begin daarvan is hiernaast getekend.

     
  e. Maak deze tekening af, en leg uit wat er bij de assen van het grondvlak moet staan.
       
3. Maak van de volgende tabel van de gewichten van een groot aantal zeemeeuwen een klassenindeling en teken een histogram. Zorg dat je ongeveer  5 á 10 staafjes hebt.
Bereken vervolgens met jouw klassenindeling het gemiddelde.
       
 
1110 1068 1005 957 902 1076 1024 780 760 755
893 733 1079 1224 1066 976 962 870 895 1120
948 1053 1131 975 940 908 910 1205 930 1040
775 967 1035 1059 1068 849 938 843 1200 1038
1241 1147 966 1228 1127 1002 1204 999 967 1001
983 875 1109 859 938 1131 842 1102 828 986
       
4. In de tabel hieronder zie je de frequentieverdeling van het aantal lesuren per week van de docenten van het Hogeland College.
       
 
klasse 10 - 14 15 - 19 20 - 24 25 - 29
frequentie 18 8 41 9
       
  a. Wat is het grootst mogelijke gemiddelde bij deze frequentieverdeling? En wat is het kleinst mogelijke gemiddelde?
       
  b. De conciërge Tjasse kent van alle docenten de precieze aantallen uren. Hij beweert dat de modus een frequentie van 8 heeft. Waarom kan dat niet kloppen?
       
 

© h.hofstede (h.hofstede@hogeland.nl)