|
|||||
We werken in dit
bewijs voor het notatiegemak met de variantie, en die is zoals je weet
gelijk aan s2 . Dat scheelt een
boel wortels typen..... Stel dat je twee series getallen {x1, x2, x3, ...., xn} en (y1, y2 , y3, ...yn} hebt. Laten we ze maar gewoon xi en yi noemen. Dan is de variantie van één zo'n serie gelijk aan |
|||||
|
|||||
Daarin is xG
het gemiddelde van de getallen. Voor y geldt uiteraard precies
dezelfde formule. Wat gebeurt er met de variantie als we de x-en en y-en bij elkaar optellen? |
|||||
Dan krijgen we een
nieuwe serie getallen: {x1 + y1,
x2 + y2, x3
+ y3, ..., xn + yn} Het gemiddelde daarvan is uiteraard xG + yG. (immers als je ze allemaal optelt kun je net zo goed eerst alle x-en optellen en daarna alle y-en) Invullen in de variantie-formule hierboven: |
|||||
nou kom op: alle haakjes eerst maar eens weg: | |||||
Daar staan aan de
rechterkant 10 termen. Gelukkig kunnen we er een aantal samennemen.... xi2
- 2xixG + xG2
= (xi - xG)2
en ook yi2 - 2yiyG
+ yG2 = (yi - yG)2
|
|||||
De som is verder in
drie aparte sommen gesplitst. Die eerste twee stukken zijn een makkie: daar staat precies sx2 en sy2 Dat laatste stuk kun je nog iets vereenvoudigen als je bedenkt dat: xiyi - xixG - yiyG + xGyG = (xi - xG)(yi - yG) ga dat maar na door de haakjes weer weg te werken....... |
|||||
|
|||||
En nou komt er een interessante
redenering....... - fijn dat ik even waarschuw toch? - |
|||||
Stel dat we al onze
punten (x, y) zouden tekenen in een assenstelsel. Zie de
figuur hiernaast. Dat zou een groot aantal stippen rondom het rode punt (xG, yG) geven. (Ik ga uit van een groot aantal punten, want tja, waarom zou je anders statistiek bedrijven? Bij statistiek geldt in het algemeen: hoe meer hoe beter) Bekijk nu alle punten met een vaste constante waarde van xi - xG. Die liggen op een verticale lijn. Ik heb als voorbeeld de blauwe lijn hiernaast genomen. Maar als die x en y waarden helemaal onafhankelijk van elkaar zijn (elkaar niet beïnvloeden) dan zullen (bij een groot aantal punten) die punten evenveel onder de lijn van yG liggen als erboven. Maar dát betekent weer dat dan (yi - yG) bij deze bepaalde xi samen NUL opleveren (evenveel erboven als eronder). |
|||||
En dat geldt natuurlijk voor elke xi !!!! | |||||
Dat betekent dat, als
x en y echt onafhankelijk van elkaar zijn, en we hebben
een erg groot aantal punten, dat die laatste term uit de
σx+y2
formule hierboven nul zal zijn! Conclusie: |
|||||
|
|||||
© h.hofstede (h.hofstede@hogeland.nl) |