© h.hofstede (h.hofstede@hogeland.nl)

Cronbach's Alfa
       
Cronbach's Alfa is een manier om van een enquête de mate van samenhang tussen de verschillende  enquêtevragen te meten. Het zegt iets over de betrouwbaarheid van de enquête.
Daarbij gaat het er wel om dat de hele test een soort "onderliggend effect"  wil meten zoals bijvoorbeeld de "mate van tevredenheid" of de "intelligentie" van een persoon. Kijk dus wel uit dat de scores  

Stel dat je een toets of enquête houdt waarbij een deelnemer de eerste vijf vragen heel goed (positief) beantwoordt en de zesde niet, maar andere deelnemers beantwoorden juist de eerste vijf slecht en de zesde heel goed. Dan moet je je afvragen of er iets met die zesde vraag aan de hand is.
       
Oké, laten we maar beginnen met een getallenvoorbeeld van hoe je die Alfa berekent.
Stel dat je 8 personen een vragenlijstje van 5 vragen hebt laten maken, waarbij de antwoorden allemaal de schaal 1 tm 5 hadden. Dat leverde bijvoorbeeld de volgende scores op:
       
persoon vraag 1 vraag 2 vraag 3 vraag 4 vraag 5 totaalscore T
1 4 3 5 1 4 17
2 1 1 1 4 2 9
3 3 4 5 1 1 14
4 1 5 5 1 5 17
5 3 1 4 4 3 15
6 4 2 3 2 5 16
7 5 5 4 2 5 21
8 1 1 1 4 1 8
gemiddelde 2,75 2,75 3,50 2,38 3,25 gem:  14,625
variantie Vi 2,50 3,07 2,50 1,98 2,69 var(T) :  18,55
       
Oh ja, voor wie het niet meer weet, de variantie van bereken je natuurlijk als volgt:

De variantie in de totaalscores is  2.
De som van de varianties van de afzonderlijke vragen was  2,50 + 3,07 + 2,50 + 1,98 + 2,69 = 12,74
Alfa wordt nu berekend door:
 

 
Daarin is N het aantal vragen,  var(Vi) de variantie van vraag Vi, en  var(T) de variantie van de totaalscores.
In dit geval is   α = 5/(5-1) * (1 - 12,74/18,55) = 0,39
       
Oké, wat zegt dit nou?
       
Toetsen worden in het algemeen als "goed" of "betrouwbaar" beoordeeld als alfa boven de 0,7 zit. Dit lijstje wordt vaak aangehouden:
       
α > 0,9
0,8 < α < 0,9
0,7 < α < 0,8
0,6 < α < 0,7
0,5 < α < 0,6
α < 0,5
  uitstekend
goed
acceptabel
dubieus
slecht
onacceptabel.
       
Deze waarderingen zijn natuurlijk nogal subjectief. Ik noem ze alleen om een soort indicatie te geven. De toets uit het voorbeeld was dus een vrij waardeloze toets.
Je kunt natuurlijk kijken of er verkeerde vragen in de toets staan. Laten we eerst eens kijken wat er gebeurt als je een vraag weglaat:
       
vraag weggelaten α
geen
1
2
3
4
5
0,39
0,05
0,09
-0,02
0,83
0,10
       
Kijk: daar lijkt iets aan de hand te zijn met die vraag 4. Die wordt laag beantwoord door mensen met wel een hoge totaalscore. Het is te overwegen om die vraag aan te passen of weg te laten.
Het zou ook kunnen dat de vraagstelling in vraag 4 net "andersom gesteld" is. Dus als bijvoorbeeld  de mate van tevredenheid wordt getoetst, dat dan de tevreden mensen op deze vraag juist laag zouden scoren. Een vraag als  "ik heb vaak onenigheid met mijn leidinggevende" met scores 
(1: helemaal oneens) - (2: oneens) - (3: neutraal) - (4: eens) - (5: helemaal eens)
In dat geval zouden nu tevreden mensen juist score 1 antwoorden. Je zou de vraag kunnen "flippen" door 1-5 en 2-4 te wisselen. Dat geeft:
       
persoon vraag 1 vraag 2 vraag 3 vraag 4 vraag 5 totaalscore T
1 4 3 5 5 4 21
2 1 1 1 2 2 7
3 3 4 5 5 1 18
4 1 5 5 5 5 21
5 3 1 4 2 3 13
6 4 2 3 4 5 18
7 5 5 4 4 5 23
8 1 1 1 2 1 6
gemiddelde 2,75 2,75 3,50 3,63 3,25 gem:  15,875
variantie Vi 2,50 3,07 2,50 1,98 2,69 var(T) :  42,41
       
nu is  α = 0,703.
       

© h.hofstede (h.hofstede@hogeland.nl)