Neem een geweldige punten wolk van wel twéé punten!
Verschuif die enorme wolk zó dat het centrale punt in de oorsprong komt te liggen.

Dan kun je stellen dat de coördinaten van die twee punten (1,1) en (-1, -1) zijn!  Immers als ze een ander getal zijn dan veranderen we gewoon de schaal van de assen totdat de waarden in onze nieuwe meeteenheid wél (1,1) en (-1,-1) zijn.

Laten we nu een derde punt toevoegen bij x = 2.
We gaan nu onderzoeken hoe groot de y van dat punt moet zijn als de r van de drie punten maximaal moet worden. Stel dat die y gelijk is aan p.

   
We hebben dus de drie punten  (1, 1) en (-1, -1) en (2, p)  dus het centrale punt is het gemiddelde:  (2/3, 1/3 p)
Dat levert deze tabel:
   
x y Δx Δy ΔxΔy Δx2 Δy2
1 1 1/3 1- 1/3p 1/3 - 1/9p 1/9 1-2/3p +1/9p2
-1 -1 -5/3 -1- 1/3p 5/3+ 5/9p 25/9 1+2/3p+1/9p2
2 p 4/3 2/3 p 8/9 p 16/9 4/9p2
   
Dan is  Cov(x, y) = 1/3 • (1/3 - 1/9p + 5/3+ 5/9p + 8/9 p) = 2/3  + 4/9p 
 
   
Dat geeft allemaal tezamen voor de correlatiecoëfficiënt:  

   
Hiernaast zie je een plot van r als functie van p,
De vraag is nu  "Voor welke p is deze r maximaal?"
Nou, als de afgeleide nul is natuurlijk:



Dat is nul als de teller nul is. Vermenigvuldig alles met die wortel en je krijgt: 
2(21 + 7p2) - 7p(3 + 2p) = 0
Dat geeft  42 - 21p = 0  ofwel  p
= 2


BINGO!

De r is maximaal als p = 2, en dat betekent dat ons derde punt (2,2) is geworden, en dus dat de drie punten precies op een rechte lijn liggen.
rmax is trouwens gelijk aan   (3 + 2 • 2)/(21 + 7 • 22) = 7/7 = 1 en dat is inderdaad wat we verwachtten als de punten exact op een rechte lijn liggen!!!!

Precies wat we graag willen van zo'n correlatiecoëfficiënt.....