© h.hofstede (h.hofstede@hogeland.nl)

Boxplots vergelijken
Je kunt een boxplot handig gebruiken om iets duidelijker aan te geven of er tussen twee metingen van verschillende groepen een (groot) verschil zit of niet.
Hieronder zie je drie setjes (in drie kleuren) van twee boxplots. De medianen van de drie bovenstens zijn gelijk en ook de medianen van de drie ondersten.
       

       
Wat alleen de medianen betreft zou je dus kunnen stellen dat de verschillen tussen de bovenste en de onderste boxplots in alle drie de gevallen hetzelfde zijn.
Toch is dat duidelijk niet zo!
De groene twee verschillen eigenlijk heel veel: er zijn eigenlijk helemaal geen gelijke metingen geweest, alles is verschillend. De grootste van de ene is nog kleiner dan de kleinste van de tweede.
De blauwe twee verschillen erg weinig, de twee middelste blauwe boxen zijn aardig vergelijkbaar, er overlappen veel metingen.
De roden zitten daar een beetje tussen in. Niet heel veel verschillend zoals de groenen, ook niet erg weinig zoals de blauwen.

Maar ja, wat vinden we een "groot" verschil en wat een "klein". Kwestie van smaak?
Je snapt wel dat een "kwestie van smaak" niet kan in de wiskunde. We maken daarom (nog steeds vrij willekeurig) de volgende afspraak:
(daarbij bedoelen we met de "box" van een boxplot het deel tussen Q1 en Q3: het eigenlijke doosje)
       
Het verschil tussen twee boxplots:
de boxen overlappen helemaal niet. het verschil is groot
de boxen overlappen wel, en minstens één van beide medianen  ligt buiten de box van de andere plot. het verschil is middelmatig
alle andere gevallen. het verschil is klein
       
       
 
                                       
  OPGAVEN.
       
1. In de laatste opgave van de vorige les bepaalden we met MaxVcp of het verschil in temperatuur tussen Kopenhagen en Parijs groot, middelmatig of gering was.
Dat deden we aan de hand van de volgende twee cumulatieve frequentiepolygonen:
       
 

       
  Bepaal met behulp van boxplots opnieuw of het verschil groot, middelmatig of gering is
       
2. Voor 5 Limburgse scholen is de gemiddelde afstand die leerlingen naar school moeten afleggen bepaald.
Dat gaf de vijf boxplots hieronder.
       
 

       
  a. Welke school heeft de grootste spreidingsbreedte? Leg duidelijk uit.
       
  b. Welke school heeft de grootste kwartielafstand? Leg duidelijk uit
       
  c. Zijn er scholen waartussen het verschil wiskundig gezien klein  genoemd kan worden? Zo ja welke?  Geef een duidelijke uitleg.
       
3. De consumentenbond heeft twee verschillende soorten 0.0 bier getest. Men vroeg een groot aantal mensen om  de merken Heineken 0.0 en Bavaria 0.0 te proeven en er een cijfer op schaal 1 tot 10 aan te geven.

Dat leverde de volgende tabel op:
       
 
cijfer 1 2 3 4 5 6 7 8 9 10
aantal bij Heineken  0.0 20 34 56 62 75 80 54 60 47 12
aantal bij Bavaria 0.0 5 20 22 45 68 83 91 72 52 22
       
  Bepaal met behulp van boxplots of het verschil tussen beide biermerken groot, middelmatig of gering is.
       
 

© h.hofstede (h.hofstede@hogeland.nl)