Andere Schalen.

© h.hofstede (h.hofstede@hogeland.nl)

   
Wiskundigen willen natuurlijk alles graag uitdrukken in getallen. Dat is nou eenmaal de wereld waarin ze zich zeker voelen en uit de voeten kunnen.
Maar soms is het echte leven niet zo mooi....

Er zijn namelijk veel "dingen" die je niet in een getal kunt uitdrukken (of waarbij het uitdrukken in een getal niet een echte betekenis heeft). Toch is de uitspraak van Heinlein hiernaast niet correct. Er valt ook met zulke "vagere" dingen best wetenschap te bedrijven.

Daarvoor is alleen vaak een andere schaalverdeling dan een getallenlijn nodig. Er zijn vier soorten schaalverdelingen te onderscheiden.

In opklimmende duidelijkheid zijn dat de volgenden:  
   
1.  Nominale schaal.
   
Bestaat uit categorieën met verschillende namen. De categorieën hebben geen grootte en er is geen volgorde in te onderscheiden.  Een voorbeeld is woonplaats of  geslacht zoals vaak op enquêtes moet worden ingevuld.
Soms wordt er wel eens volledig kunstmatig een getal aan toegekend (bijvoorbeeld  "man" = 0 en "vrouw" = 1), maar zo'n getal is alleen een andere naam en heeft geen enkele getalsbetekenis.

Als er twee eigenschappen zijn heet dat een dichotomie (of ook wel een binaire schaal, omdat er twee mogelijkheden zijn).
In zo'n geval kun je toch een correlatiecoëfficiënt uitrekenen. Noem eerst (kunstmatig) één van beide eigenschappen x = 0 en de andere x = 1. Noem de bijbehorende y-waarden  y0 en  y1, dan geldt voor de correlatiecoëfficiënt:
 
 
Daarin is p het deel van de meetwaarden dat bij x = 0 hoort, en q het deel dat bij x = 1 hoort.
   
2.  Ordinale schaal  
   
Er zijn weer een aantal categorieën die een naam hebben. Deze keer is er echter wél een volgorde aan te wijzen.
Een bekend voorbeeld is het aantal Michelin-sterren van een hotel. Daar is zeker een volgorde in (0 is het laagst, 5 het hoogst)  maar je kunt beslist niet zeggen dat een 4-sterren hotel dubbel zo goed is als een 2-sterren hotel. En je hebt geen idee hoe groot de "afstand" tussen een 1-sterren hotel en een 4-sterren hotel is.

Ook bij veel enquêtes zie je een schaal als "zeer mee oneens - mee oneens - neutraal - mee eens - zeer mee eens".
   
   
3.  Intervalschaal
   
Hé hé, dit zijn tenminste altijd getallen. 
En ook nog echte getallen, niet zomaar kunstmatig toegekende getallen.
Neem bijvoorbeeld jaartallen. Daar is niet alleen een volgorde in, je kunt ook iets zeggen over de tijd tussen twee jaartallen in. Die tijd heeft zeker een betekenis.
Het enige is, dat er geen duidelijk nulpunt bestaat.  Dat heeft tot gevolg dat je het wél over afstanden tussen twee punten op de schaal kunt hebben, maar niet over verhoudingen.
   
   
4.  Ratioschaal.  
   
Nu is er wel een absoluut nulpunt aan te geven. Dat noemen we een vast referentiepunt. Neem bijvoorbeeld de lengte van iemand in meters. Die is natuurlijk altijd gemeten vanaf een lengte NUL meter.
Nu kun je het niet alleen hebben over het verschil tussen twee waarden, maar ook over de verhouding. Je kunt immers makkelijk zeggen dat "Guus drie keer zo groot is als Patrick".
De eenheid waarmee gemeten wordt kan natuurlijk nog vrij gekozen worden, maar de NUL ligt vast.
   
   
  OPGAVEN
   
1. Met welk soort schaal heb je in de onderstaande gevallen te maken?
       
  a. Rangen in het leger.
  b. De provincie waarin je woont.
  c. Iemands opleidingsniveau.
  d. Het jaarinkomen van iemand.
  e. Onze tijdsaanduiding.
  f. Zwemdiploma's
       
2. Het domme blondje?
Onderzoek bij een groot aantal leerlingen van jouw school of er een correlatie bestaat tussen de eigenschappen "BLOND" of "NIET-BLOND"  en het wiskundecijfer op het laatste rapport. Bereken de correlatiecoëfficiënt.
       
3. a. Bij welk van bovenstaande schaalsoorten heeft het zin om verschil te maken tussen negatieve of positieve correlatie?
       
  b. Bij welk van bovenstaande schaalsoorten heeft het zin om getallen bij elkaar op te tellen?
       
  c. Bij welk van bovenstaande schaalsoorten heeft het zin om getallen met elkaar te vermenigvuldigen?
       
4. File & Kinney bedachten in 1971  een schaal om uit te rekenen wat de risicofactor van een activiteit is. Het ging vooral om het "berekenen" van de arbeidsveiligheid van werknemers. Die schaal werkt als volgt.
Bepaal van de activiteit de waarschijnlijkheid van het risico, de frequentie (= duur van blootstelling) van het risico en de ernst van de schade. Geef alle drie een getal volgens deze tabellen:
       
 
waarschijnlijkheid (W) score
bijna niet denkbaar
praktisch onmogelijk
denkbaar
mogelijk in grensgeval
ongewoon
zeer goed mogelijk
te verwachten
0,1
0,2
0,5
1
3
6
10
 
frequentie (F) score
zeer zelden (<1 keer per jaar)
zelden (1 keer per jaar)
soms (1 keer per maand
af en toe (1 keer per week)
regelmatig (1 keer per dag)
voortdurend
0,5
1
2
3
6
10
 
ernst (E) score
letsel zonder verlet
letsel met verlet
invaliditeit
1 dode
meerdere doden
1
3
7
15
40
       
  Nu geldt voor de risico-index:  R = W • F • E
Dit getal R bepaalt de actie die ondernomen moet worden:
       
 
R < 20 20 < R < 70 70 < R < 200 200 < R < 400 R > 400
zeer beperkt risico
aanvaardbaar
aandacht
vereist
maatregelen
vereist
directe verbetering
vereist
werkzaamheden
stoppen
       
  a. Met wat voor schaal heb je hier te maken?
       
  b. Er is nogal wat kritiek op deze schaal gekomen. Een aantal kritiekpunten zijn:
    De methode is subjectief.
    De risico's van verschillende activiteiten  kunnen niet worden opgeteld.
    De schaalverdelingen zijn willekeurig.
    De schaalverdelingen zijn discreet.
       
    Leg uit wat er met al deze kritiekpunten bedoeld zou worden.
       
  Toch is het idee niet onaardig....
Als je de drie tabellen zou veranderen in  P = kans per uur dat een ongeluk gebeurt,  F = aantal uren dat een activiteit wordt gedaan en E = kosten in euro in geval van een ongeluk, dan geeft de risico-index R = P • F • E  de verwachtingswaarde van het aantal euro dat de activiteit gaat kosten.
       
  c. Met wat voor schaalverdeling heb je in dit geval te maken?
       
5. Onderstaande tabel geeft voor een aantal mannen en vrouwen aan hoeveel bier (in liter) ze drinken per week.
       
 
m/v m v v m m v v v m m v m v m v v v v m v
aantal liter 2,5 2,0 2,8 0,7 1,6 0,9 0,0 1,1 1,5 4,6 2,1 6,8 3,4 2,1 0,5 0,7 1,5 3,1 3,6 2,2
       
  Onderzoek hoe groot de correlatie is tussen het man/vrouw zijn en de hoeveelheid bier die wordt gedronken.
     

r  0,39

       
     

© h.hofstede (h.hofstede@hogeland.nl)