© h.hofstede (h.hofstede@hogeland.nl)

       
1. a. Selectie van de steekproef:  men bekijkt alleen topsporters.
       
  b. Waarschijnlijk een kromlijnige samenhang:  bij erg lage en erg hoge leeftijden is de reactiesnelheid lager dan bij de middengroep. Dit is vast geen lineair verband.
       
  c. Verschillende deelpopulaties. Mannen drinken meer bier, vrouwen gebruiken meer make-up.
       
  d. Selectie van de steekproef: men bekijkt alleen kinderen met een slechte conditie
       
  e. Vertraging:  de reclame werkt niet meteen; mensen gaan later misschien meer kopen omdat ze de reclame hebben gezien.
       
2. a. Er is een duidelijk patroon in de residuplot:  de linkerpunten zijn er allemaal boven, de rechterpunten eronder.
       
  b. De som van alle residuen is niet nul, en dat moet wel.  
       
3. a. stat - edit
Zet de rentes in L1 en de prijzen in L2
stat - calc - linreg(ax + b) (L1, L2)  geeft  r = 0,45
       
  b.

     
   

Het lijkt er nogal op dat de grafiek van de prijs 2 maanden naar rechts is verschoven vergeleken met de grafiek van de rente. Kennelijk duurt het 2 maanden voordat het effect van een hogere rente invloed heeft op de prijs.

       
  c. Vergelijk de prijs in een maand met de rente 2 maanden ervoor. Dat geeft:
   
maand jan feb mrt apr mei jun jul aug sep okt nov dec
gemiddelde rente (r) - - 6,0 7,6 8,9 8,5 6,2 4,1 3,7 4,5 5,8 7,2
gemiddelde prijs (p) 200 210 260 330 350 320 250 210 200 250 400 450
       
    opnieuw invoeren als bij vraag a) geeft nu r = 0,65
       
4. a. met punt (1,1):  
   
x 2 2 3 4 5
voorspelde y MET (1,1)
y =  0,092x + 3,738
3,922 3,922 4,014 4,106 4,198
voorspelde y ZONDER (1,1)
y = -0,824x + 7,235
5,587 5,587 4,763 3,939 3,115
(verschil)2 2,772 2,772 0,561 0,028 1,173
    de som van de laatste rij is 7,306
de som van de residuen in het kwadraat (zonder (1,1) erbij)  is 34,59
D = 7,306/34,59 = 0,21
       
    met punt (2, 10):  
   
x 1 2 3 4 5
voorspelde y MET (2,10)
y =  0,092x + 3,738
3,830 3,922 4,014 4,106 4,198
voorspelde y ZONDER (2,10)
y = 0,7x + 0,7
1,4 2,1 2,8 3,5 4,2
(verschil)2 5,905 3,320 1,474 0,367 0,000
    de som van de laatste rij is 11,066
de som van de residuen in het kwadraat (zonder (1,1) erbij)  is 1,9
D = 11,066/1,9 = 5,82
       
  b. Het punt (2,10) is een uitschieter
MET (2,10) is de correlatiecoëfficiënt gelijk aan r = 0,043
ZONDER (2,10) is de correlatiecoëfficiënt gelijk aan r = 0,849
       
5. a. stat - edit
L1 de H-waarden,  L2 de B-waarden
stat - calc - linreg(ax + b) (L1, L2) geeft dan  r = 0,824
       
  b. de x en y staan symmetrisch in de formule voor r. Als je x en y met elkaar omwisselt krijg je dezelfde formule, dus dezelfde waarde.
       
  c. een grotere correlatie:  zie valkuil 2:  selectie van de steekproef.  
       
  d. list  - resid  sto L3
de maximale waarde in L3 is    -15,98 voor het laatste punt uit de tabel.
Dat levert bijdrage ongeveer 255 aan de som van de kwadraten.
       
       

© h.hofstede (h.hofstede@hogeland.nl)