Cumulatieve frequenties.

© h.hofstede (h.hofstede@hogeland.nl)

 

In de tabel hiernaast staan de rapportcijfers voor wiskunde van een brugklas van dertig leerlingen. Joke is één van de betere leerlingen en zij heeft dan ook een 8 op haar rapport.
Maar zij is nogal competitief ingesteld en wil ook graag weten hoeveel van haar klasgenootjes een even hoog of lager cijfer hebben gehaald.

cijfer frequentie
3
4
5
6
7
8
9
10
1
2
4
7
8
5
2
1

 

Om dat snel voor iedereen te kunnen aflezen maakt ze de nieuwe tabel hiernaast. Daarin staat dus bij elk cijfer niet hoeveel kinderen het haalden, maar hoeveel kinderen dat cijfer of een lager cijfer haalden.
cijfer aantal
hoogstens
3
4
5
6
7
8
9
10
1
3
7
14
22
27
29
30
Zo ziet Joke in één oogopslag dat maar liefst 27 kinderen uit haar klas een 8 of lager hadden. En zo kan ze haar vriendin Lies, die een 5 haalde, ook in één keer laten zien dat er slechts 7 kinderen waren met een 5 of minder.

Handig! Joke is er met recht trots op.
   
De nieuwe frequenties in deze tabel zijn ontstaan uit de "gewone" frequenties door alle ervóór bij elkaar op te tellen. Zo is de rode 22 in de derde kolom hiernaast bijvoorbeeld gevonden door alle rode frequenties uit de tweede kolom bij elkaar op te tellen.
Dat heten daarom "cumulatieve frequenties"  (cumulatief van "opgestapeld").

Cumulatieve frequenties worden ook wel  somfrequenties genoemd.

 
cijfer frequentie cumulatieve
frequentie
3
4
5
6
7
8
9
10

      1
   + 2
   + 4
   + 7
   + 8 ⇒

      5
      2
      1

1
3
7
14
= 22
27
29
30
Wat heb je liever?
Als je zou mogen kiezen, wat heb je dan liever; een tabel met gewone frequenties of een tabel met cumulatieve frequenties?
Neem de volgende tabel, waarin de maandinkomens van 500 volwassenen staan.
maandinkomen 0,1000] 1000,2000] 2000,3000] 3000 4000] 4000,5000] 5000,6000] 6000,7000] 7000,8000] 8000,9000]
frequentie 23 56 89 123 92 65 32 17 3
cumulatieve freq. 23 79 168 291 383 448 480 497 500
Waar heb je meer aan; de tweede rij of de derde?
Onderzoek dat maar eens door de volgende vragen te beantwoorden met de tweede rij en met de derde rij:
 
vraag A:  hoeveel inkomens á2000, 3000] zijn er?   vraag C:  hoeveel inkomens meer dan 5000 zijn er?
  met de tweede rij:   89     met de tweede rij:   65 + 32 + 17 + 3  
  met de derde rij:   168 - 79     met de derde rij:   500 - 383  
                   
vraag B:  hoeveel inkomens zijn er  4000 of lager?   vraag D:  hoeveel inkomens in á3000, 8000] zijn er?
  met de tweede rij:   23 + 56 + 89 + 123     met de tweede rij:   123 + 92 + 65 + 32 + 17  
  met de derde rij:   291     met de derde rij:   497 - 168  
                   
   
Zie je dat alléén bij vraag A de tweede rij handiger is dan de derde?
Bij de derde rij hoef je bij dit soort vragen nooit meer dan 2 getallen van elkaar af te trekken. Bij de tweede rij moet je soms veel meer getallen bij elkaar optellen (en dan is dit nog maar een mini klein tabelletje ook!).
   
Cumulatief Frequentiepolygoon  
   
Een cumulatief frequentiepolygoon (of ook wel  somfrequentiepolygoon) teken je precies zo als een gewoon frequentiepolygoon, maar dan op de y-as de cumulatieve frequenties i.p.v. de gewone.
Natuurlijk kun je weer kiezen of je die frequenties absoluut of relatief (in procenten) geeft. In het laatste  geval spreek je dan ook van een relatief cumulatief frequentiepolygoon.

Er is echter één verschil tussen cumulatieve en "gewone" frequentiepolygonen....
 
Neem bijvoorbeeld de inkomensklasse 〈3000, 4000] uit de tabel hierboven.
Die heeft cumulatieve frequentie 291.
Dat betekent dat er 291 inkomens kleiner of gelijk aan 4000 waren. Maar je weet niet precies hoe die inkomens binnen de klassen verdeeld zijn. Bij een gewoon frequentiepolygoon zetten we de stip die bij een klasse hoort maar bij het klassenmidden omdat de precieze verdeling over de klassen onbekend is.
Maar nu weten we in ieder geval zéker dat we bij 4000 al die 291 inkomens hebben gehad, en dáár gaat het bij cumulatief om. Daarom zetten we de stip van deze klasse bij  4000; het einde van de klasse.

   

cumulatieve frequenties: 
zet de stip bij het rechterklasseneinde !

   
  OPGAVEN
   
1. De volgende tabel is het resultaat van een enquête onder middelbare scholieren. Hij geeft het aantal minuten dat gemiddeld aan huiswerk wordt besteed. Maak van deze tabel een cumulatief frequentiepolygoon.
         
 
aantal minuten  0 - 20  20- 40 40- 60 60- 80 80-100 100-120 120-140 140-160
frequentie 12 36 90 86 70 47 18 4
         
2. Hiernaast staat een cumulatief frequentiepolygoon. Het geeft aan hoeveel kilometer mensen af moeten leggen naar hun werk.

     
  a. Hoeveel mensen zijn ondervraagd?
     
  b. Van welke klassenindeling is men uitgegaan?
     
  c. Hoeveel mensen woonden binnen 12 km van hun werk?
     
  d. Wat kun je zeggen over het aantal ondervraagden dat binnen 8 km van het werk woont?
     
  e. Hoeveel mensen woonden tussen de 9 en 18 km van het werk?
     
  f. Voor welke afstand geldt dat 20% van de mensen vérder van het werk afwoont?
         
3. Hieronder staan drie frequentiepolygonen. Eén gewone en twee cumulatieve.
Leg uit welke de gewone is.
         
 

         
4. Een collectant houdt collectes voor de hartstichting in de Groninger wijken Paddepoel en Selwerd.
Voor beide wijken maakt hij een cumulatief frequentiepolygoon van de donaties. Die staan in de figuur hieronder.
         
  a. Maak van het cumulatieve polygoon voor Selwerd een gewoon frequentiepolygoon.

  b. "De grafiek van Selwerd ligt boven die van Paddepoel, dus de mensen in Selwerd zijn vrijgeviger", zegt de collectant. Geef commentaar.
  c. Hoeveel procent van alle mensen gaf  tussen de 6 en 12 euro?
  d. Teken deze beide cumulatieve frequentiepolygonen opnieuw, maar nu procentueel. Wat is het voordeel van deze tweede manier?
         
5. Drie vrienden hebben tijdens de zomervakantie alle dagen bijgehouden wat de gemiddelde temperatuur op hun vakantiebestemming was. Dat gaf de volgende cumulatieve frequentiepolygonen
         
 

         
  Als je hen na afloop vroeg hoe de temperatuur was op hun vakantie dan kreeg je de volgende opmerkingen:

A:  "Slechts een páár warme dagen en meestal koud"
B:  "Ach, eigenlijk de hele tijd hetzelfde"
C:  "Meestal was het óf koud, óf warm, haast nooit gewoon daartussenin"

Bij welk cumulatief frequentiepolygoon hoort welke spreker?

         
6. Van twee dorpjes die vlak bij elkaar liggen is in een enquête het bierverbruik gemeten. Het ging om het aantal glazen bier dat een gezin per week gebruikte. Dat gaf de twee relatieve cumulatieve frequentiepolygonen hiernaast.
     
  a. Hoeveel procent van de mensen van Bdorp drinkt tussen de 10 en 40 glazen bier per week?
     
  b. Hoeveel procent van de mensen in beide dorpen samen, drinkt meer dan 20 glazen bier per week, als er in beide dorpen evenveel mensen wonen?
     
  c. Hoe is dat als Adorp dubbel zoveel inwoners heeft als Bdorp?
         
7. Hieronder staan de resultaten van een taaltoets en een rekentoets die een groep van 50 kinderen heeft gemaakt in een cumulatief frequentiepolygoon.
         
 

         
  a. Voor welke toets werden de meeste hoge scores gehaald?
     

TAAL

  b. Teken een histogram van de rekentoets.
         
  c. Guus zegt:  "Mijn rekenscore was precies de helft van mijn taalscore"
Welke taalscores kan Guus gehaald hebben?
     

0-20 en 40-50

     
8. Examenvraagstuk Havo, Wiskunde A, 2006.

Digitale fotocamera's werken op batterijen. Met standaard alkaline-batterijen kun je de camera slechts 15 minuten aan laten staan: de gebruikstijd is 15 minuten. Daarom gebruikt men voor deze camera's batterijen met een grotere gebruikstijd, meestal Lithium-batterijen of NiMH-batterijen (NiMH staat voor Nikkel Metaal Hydride).
Robbert fotografeert veel en is daarom geïnteresseerd in batterijen. Een tijdschrift over fotografie heeft NiMH-batterijen en Lithium-batterijen onderzocht. Als resultaat vonden de onderzoekers dat de gebruikstijd van beide soorten bij benadering normaal verdeeld is. Zij publiceerden over deze batterijen cumulatieve frequentiepolygonen. Zie onderstaande figuur.
         
 

         
  a. Welke van deze twee soorten heeft de grootste gemiddelde gebruikstijd? Licht je antwoord toe.
         
  We zeggen dat een type batterij betrouwbaarder is dan een ander type wanneer de standaardafwijking van de gebruikstijd kleiner is dan die van het andere type.
         
  b. Welk van de twee typen uit bovenstaande figuur is betrouwbaarder? Licht je antwoord toe.
         
         
   
Cumulatief met de TI-83.  
   
Als je een frequentietabel hebt ingevoerd in de lijsten van de rekenmachine (via STAT - EDIT), dan kun je op een eenvoudige manier een nieuwe lijst met cumulatieve frequenties maken.

Neem bijvoorbeeld de tabel hiernaast, waarbij in L1 de klassenmiddens staan en in L2 de frequenties.
Nu kun  je in L3 als volgt de cumulatieve frequenties krijgen:

• Ga op L3 staan en druk op ENTER. Dan komt de cursor onder in beeld

LIST - OPS - 6:cumSum (  en dan  L2

Dat geeft in L3 de cumulatieve frequenties:
   

   
Nu kun je deze gegevens eventueel plotten via STATPLOT  zoals we al eerder deden.
Denk er daarbij wel aan dat de stippen bij de rechterklassengrenzen moeten staan. De klassenindeling van het voorbeeld lijkt te zijn  [2.5, 7.5〉   [7.5, 12.5  enz,   dus de rechtergrenzen zijn  7.5 - 12.5 - enz.
Dat zou je goed kunnen krijgen door als x-as te nemen L4 = L1 + 2.5
   

   
   

   

steel- en bladdiagram

   

modus, mediaan, gemiddelde

   

© h.hofstede (h.hofstede@hogeland.nl)