© h.hofstede (h.hofstede@hogeland.nl)

De Normale Verdeling.
       
Als je veel statistisch onderzoek doet en daarbij erg veel frequentieverdelingen maakt dan zal je één ding opvallen:
       

Ze zijn bijna allemaal gelijk!

       
Daarmee bedoel ik  natuurlijk niet dat ze allemaal precies gelijk zijn, want hoe kan een verdeling van de gewichten van 16-jarige pubers nou gelijk zijn aan de verdeling van lengte van zonnebloemen in juli?  Nee, daarmee bedoel ik dat ze allemaal bijna dezelfde "vorm" hebben. De meeste verdelingen die je in praktijk tegenkomt zien er namelijk zó uit:
       

       
"Ja, hoor eens", hoor ik je al denken,  "Dat dat zo'n soort  symmetrische vorm wordt, met een top in het midden en aflopend naar de zijkanten, dat lijkt me nogal logisch! Het gemiddelde komt nou eenmaal het vaakst voor en hoe verder je ervan af zit, des te zeldzamer wordt het.
Zo apart is die vorm eigenlijk helemaal niet...
"

Nou, dan vergis je je!
Het was de wiskundige Carl Friedrich Gauss die inzag dat die verdelingen niet zomaar ongeveer gelijk waren; nee hij ontdekte dat die figuren PRECIES gelijk waren!!!  Tenminste dat ze allemaal dezelfde wiskundige basisvorm hadden. Hij ontwikkelde zelfs een formule voor deze figuur:

Je mag deze formule meteen weer vergeten, als je maar onthoudt dat er in deze formule twee letters staan die de vorm helemaal bepalen, en dat zijn de letters m en s.
Dat zijn oude bekenden van ons:  m is het gemiddelde en s is de standaardafwijking. Die twee zijn voor elk geval speciaal maar zodra je ze weet is de hele vorm van de verdeling bekend!
       
Gauss ontdekte deze formule op 17-jarige (!!!) leeftijd. Deze ontdekking is zo belangrijk voor de statistiek geworden, dat Gauss er in Duitsland zelfs het 10-mark biljet mee haalde. Samen met zijn kansverdeling!
Wiskundigen noemen deze figuur en deze kansverdeling de Normale Verdeling. 
(Natuurkundigen hebben het vaak over de Gauss-kromme, en we spreken ook wel van een klokvorm).

Die ontdekking van Gauss heet de Centrale Limiet Stelling.

       

Als de grootte van iets afhankelijk is van heel veel kleine dingen
(die onafhankelijk van elkaar zijn)
dan wordt het resultaat een normale verdeling.

       
Eigenschappen van de normale verdeling.
       
De normale verdeling wordt bepaald door twee getallen:  het gemiddelde en de standaardafwijking.
Het gemiddelde vind je uiteraard in het midden  (op de x-as)
De standaardafwijking is de horizontale afstand van het midden naar de plaats waar de kromme "ombuigt" .
Zie de volgende figuur.
 

       
De normale verdeling is symmetrisch ten opzichte van het gemiddelde.
De totale oppervlakte onder de figuur is 100%.
       
 
                                       
  OPGAVEN.
       
1. Examenvraagstuk HAVO wiskunde A, 2007.

Men heeft een onderzoek gedaan onder studenten. Daarbij is gekeken naar de tijd die mannelijke en vrouwelijke studenten thuis aan hun studie besteden. Het onderzoek wijst uit dat vrouwen per week meer tijd aan ‘huiswerk’ besteden dan mannen. De spreiding in huiswerktijd bij de mannen is kleiner dan bij de vrouwen. Bij beide is hier bij benadering sprake van een normale verdeling.
Vier leerlingen kregen de opdracht om in één figuur van zowel de mannelijke als
de vrouwelijke studenten een verdeling van de tijd aan te geven die de studenten thuis aan hun studie besteden. Het resultaat van deze opdracht staat in onderstaande figuur.

       
 

       
  Eén van de bovenstaande figuren past het best bij de gegevens over de studenten.
Welke figuur is dat? Licht je antwoord toe.
       
2. Hieronder staan vier klokvormen getekend.
       
 

       
  Bepaal zo goed mogelijk van elk van die klokvormen m en s.
       
3. Normale verdelingen die hoger zijn, zijn ook altijd smaller. Leg uit waarom dat logisch is.
       
4. In welk van de volgende gevallen zal er, denk je, (ongeveer) sprake zijn van een normale verdeling? Als dat niet het geval is, leg dan uit waarom volgens jou niet.
       
  a. Het jaarinkomen van de Nederlanders.
     
  b. De herseninhoud van volwassen mannen in Groningen.
     
  c. De levensduur van 1,5 Volt AA batterijen van Duracell.
     
  d. De tijd die je moet wachten op een tramhalte als die tram precies één keer per half uur komt, en je weet niet wanneer.
     
  e. De gemiddelde afstand tussen huis en school van middelbare scholieren.
     
  f. De zwangerschapsduur van Belgische vrouwen.
     
  g. Het aantal dagen dat het duurt voordat klanten hun rekening betalen.
       
 

© h.hofstede (h.hofstede@hogeland.nl)