Getallen verwerken.

© h.hofstede (h.hofstede@hogeland.nl)

Zo, dus jij wilt graag iets meer weten over de lengte van de Nederlandse mannen in 1950 en in 1970?
Nou vooruit, dan, hier zijn de gegevens van twee steekproeven:
Nederlandse mannen, 1950 (lengte in cm).
                   
177 173 176 169 181 184 178 171 176 171
174 178 182 169 178 175 170 170 173 165
180 175 179 177 179 180 176 174 173 176
170 177 173 176 183 170 172 182 182 173
178 174 171 169 176 180 174 176 178 173
179 180 179 177 175 182 182 174 178 177
170 179 176 180 181 175 181 184 177 172
186 170 183 183 177 179 176 188 176 173
172 174 174 173 170 186 184 176 175 173
179 172 176 178 171 178 173 181 171 173
176 175 182 172 181 183 176 177 177 178
178 177 176 182 174 174 180 171 181 171
179 176 175 179 183 172 174 177 170 179
177 180 172 175 172 173 176 175 179 174
174 174 174 182 177 173 176 176 179 185
171 177 177 176 174 174 181 177 177 172
175 175 174 178 174 175 179 174 170 175
169 178 175 180 173 182 173 173 178 179
173 176 180 178 176 177 173 170 180 177
175 175 168 185 181 175 168 175 167 175
169 174 180 180 180 178 175 172 180 178

Nederlandse mannen, 1970  (lengte in cm).

                   
185 173 176 171 179 176 182 186 177 180
173 179 173 176 179 179 188 180 185 170
179 175 182 185 177 186 175 179 184 183
180 175 178 179 176 176 182 184 171 180
174 184 170 186 181 171 182 181 178 182
178 173 181 177 182 182 180 171 189 182
179 180 186 182 184 179 176 188 175 186
171 179 180 185 176 179 186 176 171 179
182 177 177 182 178 184 189 167 187 185
183 176 179 181 181 177 178 178 185 185
177 176 179 181 167 181 174 189 180 177
166 180 176 177 169 183 180 179 171 181
191 180 174 175 170 180 184 178 185 177
183 188 178 179 184 187 183 183 182 176
173 179 188 176 175 183 172 180 190 169
174 179 171 183 178 175 173 175 180 173
180 181 183 176 179 178 180 183 189 181
182 175 185 171 180 177 177 188 184 177
178 177 176 179 171 181 173 170 180 176
180 186 183 174 186 181 176 181 173 185
177 181 172 179 191 175 180 179 170 176
179 175 181 179 179 175 181 181 180 186
178 187 179 181 182 182 185 178 180 181
172 177 173 181 186 174 176 179 179 179
179 171 183 181 178 173 172 173 185 180
177 178 179 182 177 176 184 184 183 175
Veel plezier ermee!
En.... weet je al iets meer?

Gegevensverwerking

Deze en een aantal volgende lessen zullen behandelen hoe je nou uit zo'n enorme brij van gegevens iets kunt zien. We zullen ons vooral bezighouden met manieren om grote hoeveelheden getallen in beeld te brengen.

De allereerste en ook simpelste manier is natuurlijk om bij bovenstaande tabellen te gaan tellen hoe vaak elke lengte voorkomt. Maak een tabel met in de eerste kolom de gemeten lengtes. Loop nu alle lengtes langs, en zet steeds een streepje in de tabel bij de lengte die je tegenkomt  ("turven" heet dat, als je elk vijfde streepje schuin legt).
 

Daar komt al iets meer structuur in. Het wordt nóg duidelijker als we deze twee tabellen op hun zijkant leggen, en in plaats van streepjes gewoon bij elke lengte een balkje tekenen waarvan de lengte gelijk is aan het aantal streepjes.
 
Dat is hiernaast gebeurd. Zo'n figuur met staafjes waarvan de lengtes aangeven hoe vaak een waarde voorkomt heet een Histogram. Let erop dat op de x-as  dus staat wát er gemeten is, en op de y-as hoe vaak de x-waarde voorkwam. Dat laatste heet de frequentie.
 
frequentie = "hoe vaak het voorkomt"
 

Als je de twee histogrammen van 1950 en 1970 onder elkaar legt kun je de verdelingen van de lengtes nog beter met elkaar vergelijken.
Geef toe: die twee histogrammen hiernaast zeggen veel en veel meer dan die verschrikkelijke tabel aan het begin!

 
Relatieve Frequenties.
Er is nog wel iets vervelends aan de hand met de twee histogrammen hierboven.
In 1970 zijn er 260 mannen gemeten, en in 1950 maar 210. Dat betekent dat de staven van het histogram  van 1970 samen langer zijn dan die van 1950. Daardoor zijn de twee figuren lastig met elkaar te vergelijken. De tweede is gewoon groter dan de eerste.
Dit probleem valt te verhelpen door de lengte van de staafjes niet gelijk te maken aan de frequentie, maar aan hoeveel procent deze frequentie van het het totaal is.
Dat heet de relatieve frequentie.
In de twee histogrammen hieronder staan die relatieve frequenties op de y-as. Dat heeft tot gevolg dat de totale lengte van alle staafjes samen in beide figuren gelijk is aan 100 (procent).
 

De oppervlakte van de figuur is 100%

 

   
   
  OPGAVEN
   
1. Teken bij onderstaande tabellen een staafdiagram of een histogram. Kies zelf welk van beiden het best past.
         
  a. Het aantal minuten dat leerlingen uit een klas gemiddeld aan hun huiswerk besteden:
     
 
minuten 0 - 20 20 - 40 40 - 60 60 - 80 80 - 100 100 - 120
aantal 2 10 8 5 3 1
     
  b. Het aantal inwoners van de 6 grootste steden van Nederland op 1 januari 2008:
         
 
stad Amsterdam Rotterdam Den Haag Utrecht Eindhoven Almere
inwoners 743600 533910 475680 258520 210330 183270
         
  c. De lengteverdeling van een grote groep Nederlandse mannen in 2006:
         
 
lengte 150 -160 160 -170 170 -180 180 -190 190 - 200 200 - 210 210 - 220
aantal 40 150 330 376 223 68 13
         
   
2. Een leraar wiskunde heeft van de rapportcijfers van zijn klas het relatieve staafdiagram hiernaast gemaakt.

     
  a. Waarom zou hij voor een staafdiagram hebben gekozen en niet voor een histogram?
     
  b. Hoeveel procent van de klas heeft een onvoldoende?
   

25%

  c. Het lijkt alsof er geen zessen zijn gevallen. Maar nader onderzoek wijst uit dat de man gewoon vergeten is de zessen er bij in te zetten! Teken de staaf van de zessen in het staafdiagram hiernaast.
         
         
3. In onderstaand staafdiagram staat de jaaromzet van een bedrijfje uitgesplitst naar seizoen:
         
         
  a. Welk jaar was de omzet het grootst?
     
  b. Welk seizoen was over deze vier jaar in totaal de omzet het grootst?
     
  c. "Goh, dit seizoen is de omzet veel lager dan in hetzelfde seizoen vorig jaar" mompelt de bedrijfsleider teleurgesteld. Wanneer kan hij dat gemompeld hebben?
     
  d. In 2005 was de totale omzet gelijk aan  80000. In de lente, zomer, herfst  was de omzet hetzelfde, maar in de winter dubbel zo groot. Teken de omzet van 2005 in de figuur hierboven.
         
  Een wiskundige ziet dat het handig is om de jaren én de seizoenen direct met elkaar te kunnen vergelijken, en verzint daarom een driedimensionaal histogram.
Het begin daarvan is hiernaast getekend.

     
  e. Maak deze tekening af, en leg uit wat er bij de assen van het grondvlak moet staan.
         
4. In welk van de volgende gevallen zou je voor een staafdiagram kiezen en in welke gevallen voor een histogram?
         
  a. Het aantal leerlingen dat in de acht groepen van een basisschool zit.
     
  b. Men heeft op een dag acht uur achter elkaar aan steeds geteld hoeveel auto's er op een weg voorbijkwamen in een uur.
     
  c. Voor een aantal leeftijdsgroepen is gemeten hoeveel procent van de mensen roken.
     
  d. Gooi honderd keer met een dobbelsteen en tel hoe vaak elk aantal ogen voorkomt.
         
5. Hieronder staan drie histogrammen, maar het opschrift van de y-as is weggevallen.
Geef bij elk van de drie aan of het om relatieve frequenties of om absolute frequenties gaat, of dat allebeide mogelijk is.
         
 

         
6. Hieronder staat in een staafdiagram het aantal patiënten dat de afdeling spoedeisende hulp van een ziekenhuis per maand heeft bezocht.
         
 

         
  a. Hoeveel procent daalde het aantal patiënten in de tweede helft van het jaar vergeleken met de eerste helft?
     
  b. In welke maand was de absolute toename vergeleken met de vorige maand het grootst?
     
  c. In welke maand was de relatieve afname vergeleken met de vorige maand het grootst?
         
7. Het bureau van Maurice de Hond verricht regelmatig peilingen om te kijken hoeveel zetels de politieke partijen bij de verkiezingen zullen gaan halen. Hieronder zie je een staafdiagram van de peilingen van 26 augustus 2012 (voor de verkiezingen van september 2012).
In dit staafdiagram staan de verwachte aantallen zetels na de verkiezingen per partij en ook de aantallen zetels die de partijen voor de verkiezingen in de tweede kamer hebben.
         
 

         
  Natuurlijk is het erg interessant hoeveel zetels elke partij wint of verliest.
         
  Maak een nieuw staafdiagram waarin voor elke partij staat aangegeven hoeveel procent zetels de partij volgens deze voorspellingen zal winnen/verliezen vergeleken met de oude situatie.
Welk probleem kom je daarbij tegen?
         
         
Leuke vondst...  
   

Iemand moest van de tabel hiernaast een staafdiagram maken, maar het lelijke aan een normaal staafdiagram hiervan is, dat die ene staaf van Amerika veel en veel langer is dan de andere vier.

Dat zou betekenen dat bij een mooi vierkant plaatje de hoogtes van de andere staven slechter af te lezen zouden zijn.
In de figuur rechtsonder zie je hoe de maker dat op een originele manier toch duidelijk wist te tekenen.

land Duitsland Nederland Amerika Frankrijk Spanje
inwoners
(miljoenen)
82 16 307 64 47
 

   
Lastige tabellen: aantallen van aantallen.

Als ergens de aantallen van zijn gemeten, dan staan er in een frequentietabel dus gemeten aantallen.   Maar de frequenties zelf zijn óók aantallen!  Dat maakt het soms lastig om je goed te realiseren wat nou de metingen zijn en wat de aantallen.
Neem het volgende geval:

Een klas vindt het leuk om bij te houden hoeveel wiskundige fouten een wiskundeleraar in een les maakt.
Dat geeft dan de volgende frequentietabel:

   
aantal lessen 12 10 9 6 2 1
aantal fouten 2 3 5 8 11 14
   
In deze tabel staan twee keer aantallen.  Wat is nou de frequentie en wat is de meting???

Bedenk je steeds goed wat er gebeurd is.  Die 12 lessen en 2 fouten betekent eigenlijk:  "Er zijn 12 lessen geweest waarin e leraar 2 fouten maakte". Dus de 12 is een getal dat aangeeft hoe vaak het getal 2 is voorgekomen.  Omdat de frequentie altijd is hoe vaak iets is voorgekomen is de 12 de frequentie, en 2 de meetwaarde.
Je kunt het ook zó zien:  in dit experiment was de klas aan het opletten of er een fout werd gemaakt. Het maken van een fout was daarom een meting.
   

 frequentie =  "Hoe vaak het is voorgekomen"
meetwaarde = "Wat men aan het meten was"

   
   
 

 

discreet en continu
   
8. In de volgende tabel staat de hoogte van de AEX-index voor een aantal opeenvolgende dagen in november 2009 gegeven.
         
 
dag 1 2 3 4 5 6 7
AEX 303,2 301,1 305,8 307,6 307,2 305,4 300,5
         
  a. Teken een staafdiagram bij deze gegevens. laat de y-as van 0 tot 310 lopen.
     
  b. Maak een tweede staafdiagram waarbij de y-as niet begint bij 0, maar bij 300.
     
  c. Leg uit welke voor- en nadelen dit tweede diagram heeft vergeleken met het eerste.
         
9. De volgende tabel geeft het aantal doelpunten in de wedstrijden van de eredivisie en de eerste divisie in een bepaald weekeinde.
         
 
aantal doelpunten 0 1 2 3 4 5 6 7
aantal wedstrijden 10 6 6 3 2 0 0 1
       
  a. Hoeveel wedstrijden werden er gespeeld?
         
  b. Teken een relatief staafdiagram.
         
10. Hiernaast staan twee bevolkingspiramiden die de opbouw van de 6 klassen van een school weergeven. Op de horizontale as staat het aantal leerlingen, gesplitst in jongens en meisjes. Op de verticale as staat de klas, de onderste staaf hoort bij er eerste klas; de bovenste bij de zesde klas.
Het zijn eigenlijk twee histogrammen tegen elkaar aan!
De bovenste piramide geldt voor 1995, de onderste voor 1994.

We nemen voor het gemak aan dat de leerlingen alleen na de zesde klas van school gaan en dat nieuwe leerlingen alleen in de eerste klas op school komen.

In 1994 is iedereen GESLAAGD!!!!

 

     
  a. Wat kun je van de resultaten van de 4e klas in 1994?
     
  b. Welk jaar zijn er waarschijnlijk weinig nieuwe eersteklassers geweest? Leg uit.
     
     
11. Geef in de volgende gevallen aan wat de meetwaarde was, en wat de frequentie was.
         
  a. De NS heeft in een periode op een bepaald station bijgehouden hoe vaak de trein in een week te laat was. Dat gaf deze tabel:
         
   
aantal keer te laat 12 14 15 18 12 22
aantal weken 3 4 5 7 9 10
         
  b. Een voetbalcoach heeft bijgehouden hoeveel wedstrijden er hoeveel gele kaarten werden gekregen door zijn team. Dat gaf de volgende tabel:
     
   
aantal wedstrijden 6 5 4 3 2 1
aantal gele kaarten 1 2 3 4 5 6
         
  c. Een leraar heeft bijgehouden hoeveel onvoldoendes er in een jaar op zijn proefwerken werden gehaald. Dat gaf deze tabel:
   
aantal  proefwerken 2 4 5 5 6 10
aantal onvoldoendes 8 4 5 7 8 10
         
  d. Van een aantal mannen is gekeken hoeveel vrouwelijke collega's ze hebben. Dat gaf de volgende tabel
         
   
aantal mannen 4 6 5 2 8 10
aantal vrouwen 2 5 6 8 9 10
         
     

© h.hofstede (h.hofstede@hogeland.nl)