|
© h.hofstede (h.hofstede@hogeland.nl)
|
|
Klassenindeling |
|
|
|
|
|
Neem de volgende
tabel met de gewichtsgegevens van 60 kinderen uit groep 8 van een aantal
basisscholen: |
|
|
|
|
gewichten kinderen groep 8. |
40,2 |
39,5 |
34,2 |
45,3 |
46,8 |
40,4 |
38,4 |
35,2 |
37,1 |
40,3 |
44,4 |
45,6 |
50,2 |
39,4 |
39,2 |
37,6 |
33,3 |
33,5 |
50,0 |
41,7 |
30,9 |
47,1 |
54,2 |
53,6 |
42,1 |
35,3 |
35,6 |
39,9 |
47,2 |
35,4 |
34,7 |
50,8 |
37,8 |
51,4 |
36,1 |
50,1 |
35,8 |
34,6 |
30,7 |
48,9 |
46,6 |
37,7 |
45,0 |
49,8 |
30,5 |
45,9 |
44,1 |
48,7 |
44,0 |
50,7 |
46,3 |
34,3 |
31,6 |
46,2 |
48,6 |
46,9 |
46,5 |
38,7 |
56,7 |
43,3 |
|
|
|
|
|
|
Het maken van een
frequentietabel heeft nu niet zoveel zin!
Zie je waarom?
Elk gemeten getal komt maar één keer voor. Dat betekent dat de
frequentietabel precies hetzelfde wordt als de tabel hierboven. De
gewichten staan dan wel netjes op volgorde, maar alle
frequentie worden gelijk aan 1. Dat geeft geen winst.
In zo'n geval is het vaak handig om de gemeten gewichten in
groepen bij elkaar te nemen. Dat heet een klassenindeling
maken, en dat gaat bijvoorbeeld zó: |
|
|
|
|
In de tabel hiernaast
zijn de gewichten van 30-35 als één groep (een klasse) geteld, met zo
als 35-40, 40-45 enz.
Toch zit er nu nog een onduidelijkheid in deze tabel.
Zie je welke?
Klassengrenzen.
Het is onduidelijk in welke klassen het getal 35 hoort. Is dat in de
eerste of in de tweede klasse? Onduidelijk!
Dat moet duidelijker!!!! |
gewicht |
aantal |
30-35 |
10 |
35-40 |
16 |
40-45 |
9 |
45-50 |
16 |
50-55 |
8 |
55-60 |
1 |
|
Je zult de grenzen
beter moeten aangeven, en daar zijn twee methoden voor op de markt:
Methode 1: Met
de notatie
- <
- <
betekent "tot
kleiner dan".
30 - < 35 betekent
dan: "30
tot kleiner dan 35" dus hoort
30 er wél bij, en 35 niet (35 is immers niet kleiner dan 35). In dat
geval hoort 35 dus in de tweede klasse (35 -
< 40)
Methode 2. Gebruik de
intervalnotatie
Bij de intervalnotatie gebruiken we de haakjes
[ en 〉 . |
[
betekent dat het getal bij het haakje er WEL bijhoort.
〉 betekent dat het getal bij het haakje er NIET
bijhoort.
Dus [30,35ñ
betekent dat 30 er nog bij hoort en 35
niet; die zit in de volgende klasse.
Als ezelsbruggetje om dit te onthouden moet je dat geknikte haakje
gewoon zien als groen-zeep helling.
Die 35 links glijdt eruit, en die 35 rechts staat stevig op het randje
en blijft erin! |
|
|
|
|
|
De volgende twee
frequentietabellen zijn dus wél goed, en ook in feite gelijk aan elkaar: |
|
|
|
|
gewicht |
aantal |
30 -
< 35 |
10 |
35 -
< 40 |
16 |
40 -
< 45 |
9 |
45 -
< 50 |
16 |
50 -
< 55 |
8 |
55 -
< 60 |
1 |
|
|
gewicht |
aantal |
[30, 35〉 |
10 |
[35, 40〉 |
16 |
[40, 45〉 |
9 |
[45, 50〉 |
16 |
[50, 55〉 |
8 |
[55, 60〉 |
1 |
|
|
|
|
|
|
Berekening van het gemiddelde. |
|
|
|
|
Daarover kunnen we
kort zijn: |
|
|
|
|
Doe alsof alle getallen van een klasse
gelijk zijn aan het klassenmidden. |
|
|
|
|
|
Voor de berekening
van het gemiddelde doe je dus alsof de tabellen hierboven gelijk zijn
aan de tabel hiernaast.
Invoeren in de GR:
L1 = 32,5 - 37,5 - 42,5 - 47,5 - .....
L2 = 10 - 16 - 9 - 16 - 8 - ....
CALC - 1Var Stats - ENTER geeft een gemiddelde
van afgerond x̅ = 42,4
Natuurlijk is dit slechts een schatting van het
gemiddelde.
Je weet immers niet hoe die getallen verdeeld zijn over de klassen.... |
gewicht |
aantal |
32,5 |
10 |
37,5 |
16 |
42,5 |
9 |
47,5 |
16 |
52,5 |
8 |
57,5 |
1 |
|
Je doet nu alsof die
10 getallen uit klasse [30, 35〉 allemaal gelijk zijn aan 32,5.
Toch zouden ze best alle 10 gelijk kunnen zijn aan 30. Dat zou wel heel
toevallig zijn natuurlijk, maar niet onmogelijk. Of allemaal 35,
dat zou ook kunnen.
In het eerste "toevallige" geval zou het gemiddelde 2,5 lager worden en
in het tweede geval juist 2,5 hoger.
Het enige dat we zeker weten is dat het gemiddelde tussen de 39,9
en 44,9 ligt |
|
|
|
|
Absoluut en Relatief
Er is nog een andere manier om frequenties weer te geven, en dat is om
niet de aantallen zélf te noemen, maar de procenten die ze van het
totaal zijn. Als je dat doet, dan heet dat de
Relatieve frequentie (in tegenstelling tot de
"echte" aantallen die we tot nu toe gebruikten; die heten ook wel de
Absolute frequentie). |
|
|
|
|
|
|
|
|
|
Voor de berekeningen
kun je gewoon doen alsof die procenten de echte aantallen zijn, dat
maakt niks uit voor de antwoorden. |
|
|
|
|
Histogrammen. |
|
|
|
|
Als je eenmaal een
frequentieverdeling met een klassenindeling hebt dan kun je daar
makkelijk een histogram van
maken.
Wat een histogram is weet je vast nog wel uit de onderbouw: zo'n
"figuur met van die staafjes" |
Een histogram van
onze bovenstaande frequentieverdeling zou er uitzien als hiernaast. Er
zijn maar een paar opmerkingen over te maken. |
|
|
|
|
1. |
De frequentie staat
altijd op de verticale as, wat er gemeten is staat op de
horizontale as. |
|
|
|
2. |
De staafjes staan
tegen elkaar aan. De horizontale as heeft een continue verdeling.
Als dat niet zo is (bijvoorbeeld bij kwalitatieve variabelen) dan staan
de staafjes los, en dan spreken we van een
staafdiagram. |
|
|
|
|
3. |
De staafjes zijn
allemaal even breed. |
|
|
|
|
4. |
Als je de breedte van
de staafjes 1 noemt, dan is de oppervlakte van het histogram gelijk aan
de totale frequentie. Als je gebruik maakt van relatieve frequenties
(dus procenten op de verticale as) dan is de totale oppervlakte gelijk
aan 100%. |
|
|
|
|
5. |
Op de horizontale as
is tussen 0 en 30 een zogenaamde "scheurlijn"
getekend om aan te geven dat er een (leeg) stuk is weggelaten. |
|
|
|
|
Leuke
vondst... |
|
|
|
|
Iemand moest van de tabel hieronder een staafdiagram
maken, maar het lelijke aan een normaal staafdiagram hiervan is, dat die
ene staaf van Amerika veel en veel langer is dan de andere vier.
|
|
land |
Duitsland |
Nederland |
Amerika |
Frankrijk |
Spanje |
inwoners
(miljoenen) |
82 |
16 |
307 |
64 |
47 |
|
|
Dat zou betekenen dat bij een mooi vierkant plaatje de
hoogtes van de andere staven slechter af te lezen zouden zijn.
In de figuur hier rechtsonder zie je hoe de maker dat op een originele manier
toch duidelijk wist te tekenen. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
OPGAVEN. |
|
|
|
|
1. |
Teken bij onderstaande tabellen een staafdiagram
of een histogram. Kies zelf welk van beiden het best past. |
|
|
|
|
|
a. |
Het aantal minuten
per dag dat leerlingen uit een klas gemiddeld aan hun huiswerk besteden
: |
|
|
|
|
|
|
minuten |
0 - 20 |
20 - 40 |
40 - 60 |
60 - 80 |
80 - 100 |
100 - 120 |
aantal |
2 |
10 |
8 |
5 |
3 |
1 |
|
|
|
|
|
|
b. |
Het aantal inwoners van de 6
grootste steden van Nederland op 1 januari 2008: |
|
|
|
|
|
|
stad |
Amsterdam |
Rotterdam |
Den Haag |
Utrecht |
Eindhoven |
Almere |
inwoners |
743600 |
533910 |
475680 |
258520 |
210330 |
183270 |
|
|
|
|
|
|
c. |
De lengteverdeling van een grote
groep Nederlandse mannen in 2006: |
|
|
|
|
|
|
lengte |
150 -160 |
160 -
170 |
170 -
180 |
180 -
190 |
190 - 200 |
200 - 210 |
210 - 220 |
aantal |
40 |
150 |
330 |
376 |
223 |
68 |
13 |
|
|
|
|
|
|
d. |
Geef in de door jou
getekende histogrammen het gemiddelde aan. |
|
|
|
|
2. |
In onderstaand staafdiagram staat de
jaaromzet van een bedrijfje uitgesplitst naar seizoen: |
|
|
|
|
|
|
|
|
|
|
a. |
Welk jaar was de omzet het grootst? |
|
|
|
|
|
b. |
Welk seizoen was over deze vier jaar
in totaal de omzet het grootst? |
|
|
|
|
|
c. |
"Goh, dit seizoen is de omzet veel
lager dan in hetzelfde seizoen vorig jaar" mompelt de bedrijfsleider teleurgesteld.
Wanneer kan hij dat gemompeld hebben? |
|
|
|
|
|
d. |
In 2005 was de totale omzet gelijk
aan 80000. In de lente, zomer, herfst was de omzet
allemaal gelijk, maar in de winter dubbel zo groot. Teken de omzet van
2005 in de figuur hierboven. |
|
|
|
|
|
Een wiskundige ziet dat het handig
is om de jaren én de seizoenen direct met elkaar te kunnen
vergelijken, en verzint daarom een driedimensionaal histogram.
Het begin daarvan is hiernaast getekend. |
|
|
|
|
|
e. |
Maak deze tekening af, en leg uit
wat er bij de assen van het grondvlak moet staan. |
|
|
|
|
3. |
Maak van de volgende
tabel van de gewichten van een groot aantal zeemeeuwen een
klassenindeling en teken een histogram. Zorg dat je ongeveer 5 á
10 staafjes hebt.
Bereken vervolgens met jouw klassenindeling het gemiddelde. |
|
|
|
|
|
1110 |
1068 |
1005 |
957 |
902 |
1076 |
1024 |
780 |
760 |
755 |
893 |
733 |
1079 |
1224 |
1066 |
976 |
962 |
870 |
895 |
1120 |
948 |
1053 |
1131 |
975 |
940 |
908 |
910 |
1205 |
930 |
1040 |
775 |
967 |
1035 |
1059 |
1068 |
849 |
938 |
843 |
1200 |
1038 |
1241 |
1147 |
966 |
1228 |
1127 |
1002 |
1204 |
999 |
967 |
1001 |
983 |
875 |
1109 |
859 |
938 |
1131 |
842 |
1102 |
828 |
986 |
|
|
|
|
|
4. |
In de tabel hieronder
zie je de frequentieverdeling van het aantal lesuren per week van de
docenten van het Hogeland College. |
|
|
|
|
|
klasse |
10 -
14 |
15 -
19 |
20 -
24 |
25 -
29 |
frequentie |
18 |
8 |
41 |
9 |
|
|
|
|
|
|
a. |
Wat is het grootst
mogelijke gemiddelde bij deze frequentieverdeling? En wat is het
kleinst mogelijke gemiddelde? |
|
|
|
|
|
b. |
De conciërge Tjasse
kent van alle docenten de precieze aantallen uren. Hij beweert dat de
modus een frequentie van 8 heeft. Waarom kan dat niet kloppen? |
|
|
|
|
|
|
© h.hofstede (h.hofstede@hogeland.nl)
|