© h.hofstede (h.hofstede@hogeland.nl)

 
Welke methode wanneer gebruiken?
 
We hebben nu vier verschillende manieren bekeken om de verschillen tussen twee groepen weer te geven.
Dat zijn:
  •  Phi-coëfficiënt.
•  Max Vcp.
•  Effectgrootte.
•  Boxplots.
       
Soms kun je om groepen te vergelijkingen meerdere van deze berekeningen toepassen, en kun je dus kiezen welke de handigste is.
Een paar dingen om om te denken:
       
Bij nominale variabelen zul je de phi-coëfficiënt moeten gebruiken. In die gevallen moet je dus een kruistabel hebben of maken.
Als je een standaardafwijking hebt dan zou ik ervoor kiezen om de effectgrootte te berekenen.
Bij gegeven frequentietabellen is het het meest handig om max Vcp te berekenen of boxplots te vergelijken. Welk van beiden, dat maakt niet zoveel uit.
       
Alles-in-één voorbeeld.
       

Gegevens over het gemiddeld aantal gedronken glazen bier per week van Nederlandse en Belgische volwassenen leverde de volgende tabel:

Glazen per week

0

1

2

3

4

5

6

7

8

BELGIE

40

52

83

121

200

354

403

202

158

NEDERLAND

31

32

44

46

65

88

100

105

109

 

Glazen per week

9

10

11

12

13

14

15

16

17

BELGIE

100

94

92

76

70

64

64

57

42

NEDERLAND

214

326

450

302

225

145

120

60

24


 

Glazen per week

18

19

20

21

22

23

24

25

BELGIE

22

20

18

17

10

8

8

4

NEDERLAND

18

14

12

12

12

9

5

1


Iemand wordt als alcoholist beschouwd als hij gemiddeld meer dan 15 glazen bier per week drinkt.
Neem aan dat de standaardafwijking in de gehele populaties steeds gelijk is aan de standaardafwijking in deze steekproeven.

Laten we al onze statistische technieken op deze gegevens toepassen.

1.  Betrouwbaarheidsinterval van een percentage.

Als je het aantal alcoholisten in België bekijkt dan zijn dat er 206 van de 2379  en dat is 8,66%
De proportie is dan 0,0866
Voor het 95% betrouwbaarheidsinterval van deze proportie bereken je dan

       

       
Dat geeft het 95%-betrouwbaarheidsinterval  [0.0866 - 0,0115 ; 0.0866 + 00115] = [0.0715 ; 0.0981]
       

2.  Betrouwbaarheidsinterval van een gemiddelde.

Als je het gemiddelde aantal glazen in Nederland met je GR berekent dan voer je in:
STAT - EDIT
L1 = 0, 1, 2, ..., 25
L2 = 31, 32, 44, ..., 1
STAT - CALC - 1VarStats geeft dan   gemiddelde 10,41 met standaardafwijking 3,94  (en aantal metingen n = 2569)

Voor het 95% betrouwbaarheidsinterval van dit gemiddelde bereken je dan

       

       
Dat geeft het 95%-betrouwbaarheidsinterval   [10.41 - 0.16 ; 10.41 + 0.16] = [10.25 ; 10.57]
       

3.  Max Vcp.

Laten we het MaxVcp van het verschil tussen Nederland en België gaan berekenen, met klassenindelingen van breedte 5.

       

 

Nederland

België

 

frequentie

procenten

cumulatief

frequentie

procenten

cumulatief

[0, 5ñ

218

8,49

8,49

496

20,85

20,85

[5, 10ñ

616

23,98

32,47

1217

51,16

72,01

[10, 15ñ

1448

56,36

88,83

396

16,65

88,66

[15, 20ñ

236

9,19

98,02

205

8,62

97,29

[20, 25ñ

50

1,95

99.97

61

2,56

99,84

25

1

0,04

100

4

0.17

100

 

2569

100

 

2379

100

 

       
De verschillen tussen de rode kolommen zijn  12,36 - 39,69 - 0,17 - 0,73 - 0,13 - 0
MaxVcp is gelijk aan 39,69 dus het verschil is MIDDELMATIG.
       
4.  Effectgrootte

Bereken met de effectgrootte of het verschil tussen het gebruikte aantal glazen in Nederland en België gering, middelmatig of groot is.

Nederland gaf een gemiddelde van 10,41 glazen met een standaardafwijking van 3,94
België geeft een gemiddelde van  7,82 glazen met een standaardafwijking van 4,72
       

       
E ligt tussen 0,4 en 0,8 dus het verschil is MIDDELMATIG.
       
5.  Boxplots

Bereken met boxplots  of het verschil tussen België en Nederland  gering, middelmatig of groot is.

De lijsten van de vorige berekening geven ook de de kwartielen en de mediaan:
Nederland:  Q1 = 9,   Med = 11,  Q3 = 13
België:  Q1 = 5,  Med = 6,  Q3 = 10

Dat geeft de volgende boxen:
       

       

De boxen overlappen wel, maar de medianen liggen buiten de andere box,  dus het verschil is MIDDELMATIG

       
6.  Phi-coëfficiënt.

Bereken met de phi-coëfficiënt of het verschil tussen het aantal alcoholisten in België en Nederland  gering, middelmatig of groot is.
Wel of geen alcoholist zijn geeft de volgende kruistabel:
       

 

Wel alcoholist

Geen alcoholist

 

België

206

2173

2379

Nederland

167

2402

2569

 

373

4575

 

       

       
Dat is kleiner dan 0,2 dus het verschil is dus GERING.
       
Zo, dan hebben we alles uit dit hoofdstuk weer even herhaald........
       
 
                                       
  OPGAVE.
       
1. Het Cito heeft van een groot aantal middelbare school leerlingen de eindcijfers op het vak Nederlands verzameld.
Die gegevens zijn uitgesplitst naar jongens en meisjes, en dat gaf de volgende tabel:
       
 
eindcijfer 3 4 5 6 7 8 9 10
jongens 12 38 56 89 143 101 21 3
meisjes 5 23 67 87 169 189 56 6
       
  a. Geef een 95%-betrouwbaarheidsinterval voor het percentage onvoldoendes bij de meisjes en jongens samen.
       
  b. Geef een 95%-betrouwbaarheidsinterval voor het gemiddelde cijfers van de jongens
       
  c. Bereken met Max Vcp of het verschil tussen de jongens en meisjes gering, middelmatig of groot is.
       
  d. Bereken met de Effectgrootte of het verschil tussen de jongens en meisjes gering, middelmatig of groot is.
       
  e. Bereken met de Boxplots of het verschil tussen de jongens en meisjes gering, middelmatig of groot is.
       
  f. Bereken met de phi-coëfficiënt of het verschil in aantal voldoendes tussen meisjes en jongens gering, middelmatig of groot is.
       

© h.hofstede (h.hofstede@hogeland.nl)