|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Statistisch onderzoek. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Een beetje
fatsoenlijk statistisch onderzoek verloopt altijd in vier etappes. Het begint allemaal met een onderzoeksvraag, ofwel: "Wat willen we met dit onderzoek ontdekken?" Daarop volgt het verzamelen van gegevens die nodig zijn om die vraag te beantwoorden. Vervolgens gaan we die gegevens analyseren, en tenslotte trekken we conclusies uit onze analyses. Na die conclusies kunnen weer nieuwe vragen zijn opgedoken, waardoor het hele stappenplan opnieuw kan beginnen. Daarom spreken we van de statistische cyclus. Laten we de 4 stappen van die cyclus even één voor één bekijken: |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
STAP 1:
de onderzoeksvraag. In deze fase stellen we meestal een hoofdvraag, en daarnaast worden vaak deelvragen gesteld die nodig zijn voor het beantwoorden van de hoofdvraag. Bovendien wordt er alvast nagedacht over wat de variabelen van het onderzoek worden (dat zijn de "dingen" die we willen gaan meten of opzoeken, en hoe we die gegevens gaan verzamelen). Zo'n onderzoeksvraag moet wel aan een aantal voorwaarden voldoen: |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Deelvragen. Nadat de onderzoeksvraag is opgesteld is het handig (en soms nodig) om een aantal deelvragen te stellen. Dat zijn afzonderlijke dingen die je nodig hebt om de onderzoeksvraag te beantwoorden of te verduidelijken. Stel dat je onderzoeksvraag is: "Hoe groot is het verschil in internetgebruik tussen mannen en vrouwen?" Dan zouden deelvragen kunnen zijn; Hoeveel tijd besteden mannen aan internet? Hoeveel tijd besteden vrouwen aan internet? Een hoofdvraag die uit twee delen bestaat kun je vaak vervangen door
een enkele hoofdvraag met een deelvraag. |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
STAP 2: gegevens verzamelen. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Gegevens kun je natuurlijk verzamelen door zelf "op pad" te gaan en
interviews of een enquête te gaan houden aan de hand van een
steekproef. Daarover
staat hieronder meer. Je kunt ook veel gegevens uit bestaande bestanden halen. Op de website van het Centraal Bureau voor de Statistiek (CBS) staan erg veel gegevens over Nederland. (http://www.cbs.nl) Je zou zelfs al je gegevens uit bestaande bronnen kunnen halen. In zo'n geval spreken we van een literatuuronderzoek. Het is vaak handig om van tevoren al te weten hoe je de gegevens later wilt verwerken omdat dat kan bepalen hoe je je vragen gaat inrichten. Voorbeeld Bij een onderzoek naar de smaak van soorten cola kun je een aantal proefpersonen cola laten waarderen. Je kunt dan deze twee soorten vragen stellen:
In het tweede geval kun je berekeningen met cijfers gaan maken (gemiddelde, standaardafwijking enz.) Wat je met de antwoorden wilt gaan doen bepaalt voor een deel hoe je je enquête inricht. |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
STAP 3. gegevens analyseren. In deze stap zul je veel gebruik maken van wiskundige manieren om gegevens te beoordelen. Ik denk daarbij aan dingen als centrummaten, spreidingsmaten en ook verschillende diagrammen om iets duidelijk te maken (EXCEL!!) STAP 4. conclusies trekken. In deze fase worden het volgende soort vragen beantwoord: - Kun je uit de analyse van je gegevens conclusies trekken, of zijn er nog meer gegevens voor nodig? - Hoe betrouwbaar zijn de conclusies? - Is er sprake van een causaal verband of niet? Dat wil zeggen: is er alleen een (toevallig) wiskundig verband of is er werkelijk sprake van oorzaak en gevolg? (daarover meer in deze volgende les). Je zou je statistisch onderzoek eventueel af kunnen sluiten met aanbevelingen voor een vervolgonderzoek. |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Steekproeven. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Als je uitspraken
over de werkelijkheid wilt doen, dan zul je moeten onderzoeken hoe die
werkelijkheid er uitziet. Om absoluut zeker van je zaak te zijn zou je natuurlijk gewoon alles moeten onderzoeken, maar in praktijk is dat vaak niet haalbaar. |
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Stel bijvoorbeeld dat je "Maurice" heet en graag wilt weten hoeveel mensen in Nederland op de VVD zullen gaan stemmen. Dan kun je moeilijk heel Nederland gaan enquêteren. Dat zou iets teveel werk zijn. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Je zult je tevreden moeten stellen met een kleine selectie die je kunt onderzoeken en dan moet je maar hopen dat de eigenschappen van die selectie (wel of niet VVD) een beetje kloppen met heel Nederland. |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Een tweede reden kan natuurlijk
ook zijn dat het te duur zou zijn om de hele populatie te bekijken.
Bijvoorbeeld als je van de bevolking van een klein dorpje wilt weten
hoeveel mensen drager van een bepaalde ziekte zijn zou het best eens te
duur kunnen zijn om alle mensen aan een medisch onderzoek te
onderwerpen. En een derde reden zou kunnen zijn dat je onderzoek destructief is. Dat betekent dat de elementen uit je steekproef verloren gaan. Als je bijvoorbeeld per se wilt weten hoeveel jaarringen de bomen in een bos gemiddeld hebben kun je moeilijk het hele bos omzagen....
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Populatie | = | alles wat je zou
kunnen onderzoeken. In het voorbeeld van Maurice is de populatie niet heel Nederland, maar alleen de mensen in Nederland die mogen stemmen. |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Steekproef | = | het deel van de populatie dat je werkelijk gaat onderzoeken. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Aselect | = | Een steekproef is aselect als elk element van de populatie een even grote kans heeft om in de steekproef te komen. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Representatief |
= |
Een steekproef is
representatief als de onderzochte eigenschappen kloppen met de hele
populatie. Maar ja, dat weet je natuurlijk nooit zeker; je weet immers nog niet hoe die eigenschappen in de populatie verdeeld zijn. Als je dat wél zou weten is de steekproef nogal overbodig.... |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Voorbeelden van fouten. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Hier zie je een paar
voorbeelden van steekproeven waarbij fouten gemaakt zijn. Ofwel
steekproeven die niet representatief zijn. Flauw voorbeeld 1. In een enquête wordt de vraag gesteld: "Vult U graag enquêtes in?" Ik zal je niet beledigen door uit te leggen waarom dat een nogal domme vraag is...... Je kunt bijna net zo goed mensen een enquête per E-mail sturen en vragen "Heeft U een computer...?" Flauw voorbeeld 2. Een leerling van de middelbare school wil voor zijn profielwerkstuk onderzoeken hoeveel er gerookt wordt door medeleerlingen. Hij gaat daarom aan het begin van de pauze buiten staan en vraagt aan de eerste 10 leerlingen die naar buiten komen of ze roken of niet. Ik hoop dat je het logisch vindt dat het aantal rokers in de steekproef veel groter is dan in de populatie.... Subtiel voorbeeld 3. Een busmaatschappij wil graag weten hoe vol de bussen zitten. Men laat daarom een student op een busstation rondlopen en aan zoveel mogelijk mensen vragen: "Met hoeveel mensen zat U in de bus?" Zie je dat het aantal mensen in een bus op deze manier veel te groot wordt? Stel bijvoorbeeld dat er 25 ritten zijn, met bezetting respectievelijk 1,2,3,4,...,24,25 passagiers. Dan is de gemiddelde bezetting natuurlijk gelijk aan 13 mensen per bus. Maar wat zeggen de passagiers die we ondervragen? Als de enquête perfect is, en we ondervragen ALLE mensen, dan krijgen we deze antwoorden: |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Het gemiddelde van al
deze getallen is:
(1 • 1 + 2 • 2 + 3 • 3 + ....) / (1 + 2 + ... + 25) = 17. FOUT DUS!!! |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Steekproefproportie en
populatieproportie. Stel dat je een steekproef hebt gehouden onder een aantal HAVO-4 leerlingen en je hebt bijvoorbeeld gevraagd of zij roken of niet. Dan komt daar een bepaald percentage uit van rokers. Als je zo'n percentage weergeeft als cijfers achter de komma, dan heet dat een proportie.
Bijvoorbeeld: |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Als je steekproef representatief was (en dat hoop je natuurlijk) dan zal jouw gevonden steekproefproportie dicht in de buurt liggen van de werkelijke (maar onbekende) populatieproportie: | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Nou is die populatieproportie een puur theoretisch getal, dat je als onderzoeker nooit kent. Immers als je dat wel zou kennen zou je helemaal geen steekproef hoeven te doen. Dûh! | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Gelaagde
Steekproef. Soms is een bepaalde eigenschap in de populatie zó belangrijk dat je zeker wilt weten dat de aantallen in je steekproef daarvoor zeker kloppen met de werkelijkheid. Als je weet hoe die eigenschap in de populatie is verdeeld kun je daar makkelijk rekening mee houden. Als je dat doet dan heet dat een gelaagde steekproef (ook wel een gestratificeerde steekproef). Stel bijvoorbeeld dat je weet dat in de populatie 34% uit vrouwen bestaat en 66% uit mannen. Als je dan een steekproef van 80 mensen wilt houden reken je vooraf uit hoeveel 35% en 65% daarvan is. Dat is natuurlijk 0,34 • 80 = 27,2 ≈ 27 vrouwen en 0,66 • 80 = 52,8 ≈ 53 mannen. Je neemt dan dus 27 vrouwen en 53 mannen in je steekproef. Dan is in ieder geval de verhouding man-vrouw alvast representatief. Natuurlijk moet je daarna wel aselect gaan kiezen welke mannen en vrouwen je in je steekproef neemt. |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
© h.hofstede (h.hofstede@hogeland.nl) |