|
|||||
De minimax-stelling | |||||
John von Neumann (1903-1957) wordt algemeen beschouwd als een van de
grootste wiskundigen uit de moderne geschiedenis. Hij wordt beschouwd
als de grondlegger van de speltheorie en
publiceerde met Oskar Morgenstern het
klassieke boek Theory
of Games and Economic Behavior in 1944. |
|
||||
Hij had het cruciale inzicht dat er in zero-sum spellen met gemengde
strategieën toch altijd een (soort van) Nash-evenwicht te vinden is. Dat
deed hij met onder andere zijn
minimax-stelling. Die zullen we in deze les bekijken. |
|||||
Ik herhaal eerst nog
even de al in een eerdere les genoemde minimax- en maximin- strategieën: Noem x1, x2, ...xn de kansen op de strategieën 1 tm n voor S1 Noem y1, y2, ... ym de kansen op de strategieën 1 tm m voor S2 Noem u(x, y) de opbrengst voor S1 van strategie (x, y). Dan geldt: Strategie a is maximin-strategie voor S1 als: miny(a, y) ³ miny(u(x, y)) Daar staat dat strategie a voor S1 de grootste winst van alle x-strategieën oplevert. Ofwel dat S1 de hoogste waarde uit de rij van de matrix kiest. Je zou kunnen zeggen: strategie a is maxx(minyu(x , y)) Strategie b is minimax-strategie voor S2 als: maxx(x, b) £ maxx(u(x, y)) Daar staat dat strategie b voor S2 het kleinste verlies van alle y-strategieën oplevert. Ofwel dat S2 de laagste waarde uit de kolom van de matrix kiest. Je zou kunnen zeggen: strategie b is miny(maxxu(x , y)) |
|||||
We zagen in de vorige les al dat voor een Nash-evenwicht zal gelden: | |||||
|
|||||
Daar staat dat (a,
b) een Nash-evenwicht is als strategie a voor S1
een maximin-strategie is en tegelijkertijd voor S2 een
minimax-strategie. Zo, nou zijn we weer helemaal bijgepraat. Over naar de minimax-stelling. |
|||||
Minimax-stelling. Eerst maar een voorbeeld. Neem de volgende Spelmatrix A: |
|||||
|
|||||
Stel verder dat S1
de kansvector X(0.2, 0.3, 0.5) gebruikt en S2 de
kansvector Y(0.1, 0.2, 0.7). Dan is de verwachte winst voor speler S1 gelijk aan X × (AY) = 1,68 (en voor S2 dus automatisch -1,68) Speler S1 kan natuurlijk ook zó gaan redeneren: |
|||||
|
|||||
Zoals je intussen weet was dit een maximin-taktiek. | |||||
En omgekeerd kan speler S2 zó redeneren: | |||||
|
|||||
Zoals je intussen weet was dit een
minimax-taktiek Maar als ik speler S1 was, dan zou ik wel even voor allerlei andere vectoren (x1, x2, x3) óók gaan berekenen wat de minimale winst zal zijn, niet alleen maar voor deze ene vector. Nou, ik ben zo aardig geweest om
voor S1 een Excel-bestand te maken met alle mogelijke
variaties van x1, x2, en x3
met stapjes van 0,05 te bekijken. |
|||||
|
|||||
Bovenaan in het
oranje staan de kansen x1 Links in het blauw staan de kansen x2 (de kans x3 is dan gelijk aan 1 - x1 - x2) Op de kruising staat de verwachte minimale winst voor S1. Je ziet dat de grootste gegarandeerde winst die S1 kan halen gelijk is aan 1,8. Dat is hier zo bij de vectoren X(0.10, 0.20, 0.70) of X(0.15, 0.20, 0.65) Uiteraard zou je daartussen nog meer stapjes in de kansen kunnen nemen om dit nog verder te onderzoeken. Dan vind je een grootste gegarandeerde winst voor S1 van 1,8333 (met x1 = x2 = 0,1667) En je voelt het natuurlijk al wel aankomen..... ook S2 kan zo'n onderzoek verrichten om te kijken wanneer zijn maximale verlies zo klein mogelijk is. Dat heb ik ook maar even voor hem gedaan, en dat leverde de volgende figuur: |
|||||
|
|||||
Je ziet dat het
kleinste maximale verlies dat S2 kan halen gelijk is
aan 1,85. Dat is hier zo bij de vector Y(0.30, 0.15, 0.55) Ook hier zouden we nog verder kunnen "inzoomen" door de kansen in kleinere stapjes te nemen. Dan vind je een kleinste maximaal verlies van 1,8333 (met y1 = 0,3333 en y2 = 0,1666) |
|||||
Nou ja, Zeg!!!! |
|||||
Of zou die matrix
A net zo gekozen zijn dat dit zo uitkomt? Nou ik kan je zeggen: Dat is niet zo. Er komt ALTIJD voor beiden hetzelfde uit. Als je het niet gelooft (dat deed ik eerst ook niet) probeer het dan maar uit met het Excel-bestand. Dat kun je hier vinden en daar kun je een willekeurige 3´3 matrix A invullen. En dat is nou precies wat von Neumann met zijn minimax-stelling bewees: |
|||||
|
|||||
Het geniale hiervan
zit hem er niet zozeer in dat hij dit ontdekte. We zagen zelf al dat dat met een beetje Excel wel te vinden is, alhoewel ik eerlijk moet zeggen dat het met meer dan 3 keuzes voor S1 of S2 wel veel werk wordt. Maar goed, een beetje computer kan dat wel. Nee, het geniale zit hem erin dat von Neumann deze stelling bewees in het algemene geval!!! OK; om dat bewijs te snappen hebben we denk ik een nieuwe les nodig.... |
|||||
© h.hofstede (h.hofstede@hogeland.nl) |