Soms staat er in een opgave dat je iets moet
uitrekenen met de normale verdeling terwijl je gewoon weet dat het niet
normaal verdeeld is.
Dat is meestal zo als je een discreet getal moet berekenen.
Bijvoorbeeld: het aantal verkeersongelukken in een stad
per week is normaal verdeeld met een gemiddelde van 14,6 en een
standaarddeviatie van 2,3. In hoeveel procent van de weken is
het aantal ongelukken minder dan 19?
Daar hoort dit plaatje bij:
Je wilt een berekening maken met de vloeiende klokvorm, maar eigenlijk
gelden de staafjes.
Als je uitrekent normalcdf(-¥,
18, 14.6, 2.3)
= 0,9303,
dan vind je de oppervlakte vanaf links tot de waarde 18, dus tot de blauwe
lijn. Maar het moet tot de rode lijn! dat scheelt maar liefst een halve
staaf!
Dat kun je compenseren door de normale verdeling tot 18,5 te nemen. Dat
heet de continuïteitscorrectie. Zo hanteer je tenminste ook met de
klokvorm de rode grenslijn.
normalcdf(-¥, 18.5, 14.6, 2.3) = 0,9550
is een betere benadering.
als je een
normale berekening toepast
op discrete getallen, dan moet je
de continuïteitscorrectie toepassen