© h.hofstede (h.hofstede@hogeland.nl)

       
We werken in dit bewijs voor het notatiegemak met de variantie, en die is zoals je weet gelijk aan s2 . Dat scheelt een boel wortels typen.....
Stel dat je twee series getallen   {x1, x2, x3, ...., xn}  en  (y1, y2 , y3, ...yn}  hebt.
Laten we ze maar gewoon xi en yi noemen.
Dan is de variantie van één zo'n serie gelijk aan

       
Daarin is xG  het gemiddelde van de getallen. Voor y geldt uiteraard precies dezelfde formule.

Wat gebeurt er met de variantie als we de x-en en y-en bij elkaar optellen?
       
Dan krijgen we een nieuwe serie getallen:  {x1 + y1,  x2 + y2x3 + y3, ...,  xn + yn}
Het gemiddelde daarvan is uiteraard  xG + yG. (immers als je ze allemaal optelt kun je net zo goed eerst alle x-en optellen en daarna alle y-en)
Invullen in de variantie-formule hierboven:
       
nou kom op:  alle haakjes eerst maar eens weg:
Daar staan aan de rechterkant 10 termen.
Gelukkig kunnen we er een aantal samennemen....

xi2 - 2xixG + xG2 = (xi - xG)2   en  ook   yi2 - 2yiyG + yG2 = (yi - yG)2

Dat geeft al een  versimpeling:

       
De som is verder in drie aparte sommen gesplitst.
Die eerste twee stukken zijn een makkie:  daar staat precies  sx2  en  sy2
Dat laatste stuk kun je nog iets vereenvoudigen als je bedenkt dat:   xiyi - xixG - yiyG + xGyG = (xi - xG)(yi - yG)   ga dat maar na door de haakjes weer weg te werken.......
       

       
En nou komt er een interessante redenering.......
fijn dat ik even waarschuw toch? -
 
Stel dat we al onze punten (x, y) zouden tekenen in een assenstelsel. Zie de figuur hiernaast.
Dat zou een groot aantal stippen rondom het rode punt (xG, yG)  geven. (Ik ga uit van een groot aantal punten, want tja, waarom zou je anders statistiek bedrijven? Bij statistiek geldt in het algemeen:  hoe meer hoe beter)

Bekijk nu alle punten met een vaste constante waarde van xi - xG.  Die liggen op een verticale lijn. Ik heb als voorbeeld de blauwe lijn hiernaast genomen.

Maar als die x en y waarden helemaal onafhankelijk van elkaar zijn (elkaar niet beïnvloeden) dan zullen (bij een groot aantal punten) die punten evenveel onder de lijn van yG liggen als erboven. 

Maar dát betekent weer dat dan  (yi - yG) bij deze bepaalde xi samen NUL opleveren (evenveel erboven als eronder).
       
En dat geldt natuurlijk voor elke  x!!!!
       
Dat betekent dat, als x en y echt onafhankelijk van elkaar zijn, en we hebben een erg groot aantal punten, dat die laatste term uit de σx+y2  formule hierboven nul zal zijn!
Conclusie:
       

als x en y onafhankelijk van elkaar zijn, dan geldt:   σx+y2 = σx2 + σy2

       

© h.hofstede (h.hofstede@hogeland.nl)