Als de regressielijn
de lijn y = ax + b is, dan geldt voor
de residuen di: di
= yi - (axi + b) = yi
- axi - b Maak daar Δxi en Δyi van: |
|
Neem nu de som van de kwadraten daarvan: | |
Maar dat laatste stuk is nul! Als je de
haakjes wegwerkt krijg je zes stukken, waar steeds
Σ(Δxi)
of
Σ(Δyi)
in staat. en die zijn beiden nul omdat de totale afwijkingen van het gemiddelde nul zijn. Dat is nou eenmaal de definitie van het gemiddelde ergens van. Er blijven dus twee termen over, die allebei positief zijn (het zijn kwadraten). De som daarvan is minimaal als beiden minimaal zijn. De tweede is makkelijk: |
|
De eerste is wat lastiger: |
|