Randomized Response

© h.hofstede (h.hofstede@hogeland.nl)

       
   
Er zijn vragen waar niet iedereen altijd een eerlijk antwoord op geeft.
Zo blijken veel mannen op de vraag:  "Bezoekt u wel eens een prostituee?" te antwoorden met "Nee". Nou weet ik wel dat er best veel mannen zijn die inderdaad geen prostituees bezoeken, maar in tests blijkt dat aantal toch altijd veel groter dan in werkelijkheid.....

Zo antwoordt er ook haast nooit iemand op de vraag: "Heeft u wel eens stiekem een moord gepleegd?"  met "Ja". En ook  "Slaat u uw vrouw wel eens?" wordt haast altijd met "Nee" beantwoord.

       
De wiskundige Stanley Warner bedacht in 1965 een manier om op zulke "gevoelige" vragen toch een eerlijk antwoord te krijgen, en de techniek waarmee dat kan heet  "randomized response".

Hoe het werkt.

De deelnemers aan een enquête moeten bij zo'n gevoelige vraag eerst een muntstuk opgooien (zonder iemand het resultaat te vertellen). Degenen die KOP hebben gegooid moeten de vraag verplicht met JA beantwoorden (ook  al is het voor hen NEE). Degenen die MUNT hebben gegooid moeten eerlijk antwoorden.
Uit de gegevens van zo'n test kan een onderzoeker dan toch de waarheid achterhalen.

rekenvoorbeeldje.
Stel dat de vraag was  "Gebruikt u wel eens marihuana?". Stel verder dat  460 mensen nu JA zeggen en 238 mensen NEE.
Er waren in de test dus 698 mensen. Dus zal er ongeveer 349 keer KOP zijn gegooid, en die 349 mensen moesten verplicht JA zeggen.
Er blijven dan nog 349 mensen over die eerlijk hebben geantwoord, en daarvan hebben er 238 NEE gezegd en dus 111 JA. Dat betekent dat  111/349 × 100% ≈ 32% van de mensen wel eens marihuana gebruikt.

Handig toch?  Iedereen kan geheel veilig eerlijk beantwoorden, want als je JA hebt ingevuld weet niemand af dat was omdat je KOP gooide of omdat je de waarheid hebt gesproken.
       
           
1. Op de diploma-uitreiking van een middelbare school wil de wiskundeleraar nou wel eens weten hoeveel er bij het behalen van een diploma gefraudeerd wordt.
Hij geeft daarvoor eerst alle gediplomeerden in de zaal de opdracht willekeurig het getal 1 of 2  in gedachten te nemen. Daarna stelt hij de centrale vraag:  "Heb je voor het halen van je diploma wel eens gefraudeerd?" (frauderen is spieken, werkstukken kopiëren, plagiaat e.d.).
Iedereen die een 1 in gedachten had moet zijn hand opsteken, en ook iedereen die een 2 in gedachten had en inderdaad heeft gefraudeerd moet zijn hand opsteken.
Van de 124 gediplomeerden steken er 100 hun hand op!!!!!

Hoeveel procent zal naar schatting voor het halen van het diploma hebben gefraudeerd?
         

61,3%

           
2. In de oorspronkelijke versie stelde Warner twee vragen die elkaars tegengestelde waren. Bijvoorbeeld:

vraag 1:  "Heeft u wel eens zwart gewerkt?"
vraag 2:  "Heeft u nog nooit zwart gewerkt?"

De deelnemers moesten een dobbelsteen gooien. Als ze 6 gooiden moesten ze de eerste vraag eerlijk beantwoorden, bij iets anders dan 6 de tweede vraag eerlijk.
           
  a. Stel dat 85 van de 120 geïnterviewden "JA" antwoordde.
Hoeveel procent van hen zal dan naar schatting wel eens zwart hebben gewerkt?
         

18,75%

  b. Stel dat de kans dat je de "gevoelige" vraag moet beantwoorden gelijk is aan p (in het voorbeeld 1/6)
Stel verder dat P procent van de mensen de gevoelige vraag inderdaad eerlijk met JA zouden beantwoorden (in het voorbeeld de echte zwartwerkers).
Stel tenslotte dat J het aandeel JA-zeggers in de enquête is (in het voorbeeld 80/100 = 0,8)
Dan leidde Warner de volgende formule af:
   

    Toon aan dat deze formule correct is.
           
3. Een onderzoeker laat een groep van 40 mensen eerst met een muntstuk gooien.
De KOP-gooiers moeten een gevoelige vraag met JA beantwoorden.
De MUNT-gooiers moeten eerlijk antwoorden.

Na afloop concludeert de onderzoeker dat 45% van de mensen de gevoelige vraag eerlijk met JA beantwoordt.
Hoeveel JA antwoorden kreeg hij in zijn onderzoek?
         

  29 

           
Unmatched Count.

Dit is een techniek om een eerlijk antwoord op een gevoelige vraag te krijgen die nogal lijkt op de randomized response.
Twee even grote groepen mensen krijgen een aantal vragen te beantwoorden, waarbij de mogelijke antwoorden steeds JA of NEE zijn. De eerste groep krijgt alleen maar onbenullige, onschuldige simpele vragen.
De tweede groep krijgt precies diezelfde vragen  plus één extra gevoelige vraag.

Maar de deelnemers hoeven niet precies al hun antwoorden te geven. Ze hoeven alleen maar te zeggen hoeveel vragen ze in totaal met JA hebben beantwoord!!! Zoals je ziet: is het weer geheel veilig om eerlijk te antwoorden. Niemand weet op welke vragen je JA hebt geantwoord.

Maar ja, als de eerste groep bijvoorbeeld in totaal over alle deelnemers 130 JA-antwoorden had, en de tweede groep  142, dan zal de tweede groep 12 keer JA op de gevoelige vraag hebben geantwoord. En omdat je de groepsgrootte weet, weet je ook de kans op een JA-antwoord op de gevoelige vraag.
       
           
4. Een onderzoeker heeft groep 1 in totaal 20 oninteressante vragen laten beantwoorden, en groep 2 dezelfde 20 vragen plus één gevoelige vraag.
Hij kreeg in groep 1 samen van alle 30 deelnemers  270 keer JA.
Groep 2 hadden 40 deelnemers en die antwoordden in totaal samen  385 keer JA.

Hoeveel procent van de deelnemers zal naar verwachting de gevoelige vraag met JA hebben beantwoord?
         

62,5%

           
         

© h.hofstede (h.hofstede@hogeland.nl)