De wet van Benford

© h.hofstede (h.hofstede@hogeland.nl)

   
Hiernaast staan twee balansen van een bepaald bedrijf. Men vermoedt dat er bij één van beide jaren gesjoemeld is. Stel jij werkt bij een accountantsbureau en moet onderzoeken welke cijfers kloppen en welke niet. Nogal een werkje; alle boeken doornemen, rekeningafschriften en bonnetjes doorspitten, noem maar op.
Gelukkig geeft de wiskunde je een eerste test om te onderzoeken welke balans mogelijkerwijze de foute is!
Dat is de beroemde:

Geconsolideerde balans

 

2005/2006

 

2004/2005

  EUR 000   EUR 000
Activa      
Materiële vaste activa

6.810

 

5.936

Vorderingen 3.342   3.322
Gebouwen 13.763   12.931
Transportmiddelen 3.444   5.223
Machines/installaties 3.812   4.002
Octrooien 1.003   971
Researchinvesteringen 2.897   1.650
Geassocieerde investeringen 408   411
Overige vaste activa 154   292
Personeelsbeloningen 49   23
Actieve belastinglatenties 2.490   2.091
Totaal vaste activa 38.172   36.852
Voorraden grondstoffen 10.920   14.196
Voorraden gereed product 3.662   3.554
Debiteuren 9.140   7.682
Vooruitbetaalde kosten 2.998   3.165
Liquide middelen 1.334   896
Totaal vlottende activa 28.054   29.493
Totaal activa 66.226   66.345
       
Eigen vermogen      
Geplaatst kapitaal 665   663
Agioreserve 10.596   8.451
Overige Reserves 8.111   5.118
Aandelenkapitaal 3.754   3.481
Ingehouden winsten 4.784   6.086
Totaal eigen vermogen 27.910   23.799
Verplichtingen      
Rentedragende leningen 2.519   4.349
Derivaten 542   377
Pensioenverplichtingen 1.128   982
Belastingverplichtingen 557   962
Totaal langlopende verplichtingen 4.746   6.670
Rekeningcourantkredieten 16.5402   13.185
Handelsschulden 14.144   7.215
Belastingschulden 7.422   4.206
Voorzieningen 1.325   1.076
Totaal kortlopende verplichtingen 39.431   25.682
Totaal verplichtingen 44.177   32.350
Totaal eigen vermogen en verplichtingen 72.087   56.151
WET VAN BENFORD
Die zegt het volgende:
Als je een grote lijst willekeurige data hebt, dan komen alle begincijfers niet even vaak voor. Je zou misschien verwachten dat alle cijfers met frequentie 10%  voorkomen, maar dat is dus niet zo. Het blijkt dat geldt:
Daarin is P(c) de kans dat cijfer c begincijfer is.
De volgende tabel blijkt dus te gelden:
begincijfer 1 2 3 4 5 6 7 8 9
frequentie (%) 30,1 17,6 12,5 9,6 7,9 6,7 5,8 5,1 4,6
Het blijkt dat de begincijfers op een logaritmische schaal redelijk gelijkmatig verdeeld zijn:

Het percentage dat een begincijfer voorkomt is gelijk aan het deel van deze getallenlijn dat dat cijfer bestrijkt:

Genoeg over deze wonderbaarlijke wet. Als je er meer over wilt weten moet je de uitwerking van de praktische opdracht daarover maar lezen. Die staat hier. Daar kun je meer vinden over de plaatsen waar deze wet opduikt en wat het met getallenstelsels te maken heeft.

Terug naar onze balansen.

Laten we die maar eens de "Benford-test" geven. We tellen de frequentie van de begincijfers van alle "willekeurige" getallen (dus niet de opgetelde getallen). Dat geeft de volgende tabel:
begincijfer 1 2 3 4 5 6 7 8 9
Benford 30,1 17,6 12,5 9,6 7,9 6,7 5,8 5,1 4,6
2004/2005 17,2 10,3 17,2 13,8 10,3 6,9 6,9 6,9 10,3
2005/2006 34,5 13,8 17,2 13,8 6,9 6,9 3,4 3,4 3,4
Een tekeningetje maakt vaak nog veel meer duidelijk:

Het is duidelijk dat de cijfers van 2005/2006 veel beter kloppen met de wet van Benford dan die van 2004/2005.
Daarom zou ik als accountant eerst maar eens kritisch gaan kijken naar die laatsten....

(natuurlijk is dit maar een veel te klein en gefingeerd voorbeeld, maar het gaat om het idee natuurlijk, dat snap je hopelijk wel).

© h.hofstede (h.hofstede@hogeland.nl)