Nieuwe pagina 1

© h.hofstede (h.hofstede@hogeland.nl)

De minimax-stelling

John von Neumann (1903-1957) wordt algemeen beschouwd als een van de grootste wiskundigen uit de moderne geschiedenis. Hij wordt beschouwd als de grondlegger van de speltheorie en publiceerde met Oskar Morgenstern het klassieke boek Theory of Games and Economic Behavior in 1944.

Hij had het cruciale inzicht dat er in zero-sum spellen met gemengde strategieën toch altijd een (soort van) Nash-evenwicht te vinden is. Dat deed hij met onder andere zijn minimax-stelling.

Die zullen we in deze les bekijken.

Ik herhaal eerst nog even de al in een eerdere les genoemde minimax- en maximin- strategieën:

Noem x₁, x₂, ...x_n de kansen op de strategieën 1 tm n voor S₁
Noem y₁, y₂, ... y_m de kansen op de strategieën 1 tm m voor S₂
Noem u(x, y) de opbrengst voor S₁ van strategie (x, y).
Dan geldt:

Strategie a is maximin-strategie voor S₁ als: min_y(a, y) ³ min_y(u(x, y))
Daar staat dat strategie a voor S₁ de grootste winst van alle x-strategieën oplevert. Ofwel dat S₁ de hoogste waarde uit de rij van de matrix kiest.
Je zou kunnen zeggen: strategie a is max_x(min_yu(x , y))

Strategie b is minimax-strategie voor S₂ als: max_x(x, b) £ max_x(u(x, y))
Daar staat dat strategie b voor S₂ het kleinste verlies van alle y-strategieën oplevert. Ofwel dat S₂ de laagste waarde uit de kolom van de matrix kiest.
Je zou kunnen zeggen: strategie b is min_y(max_xu(x , y))

We zagen in de vorige les al dat voor een Nash-evenwicht zal gelden:

u(a, b) = max_x(min_yu(x, y)) = min_y(max_xu(x, y))

Daar staat dat (a, b) een Nash-evenwicht is als strategie a voor S₁ een maximin-strategie is en tegelijkertijd voor S₂ een minimax-strategie.

Zo, nou zijn we weer helemaal bijgepraat.

Over naar de minimax-stelling.

Minimax-stelling.

Eerst maar een voorbeeld.
Neem de volgende Spelmatrix A:

Stel verder dat S₁ de kansvector X(0.2, 0.3, 0.5) gebruikt en S₂ de kansvector Y(0.1, 0.2, 0.7).
Dan is de verwachte winst voor speler S₁ gelijk aan X × (AY) = 1,68 (en voor S₂ dus automatisch -1,68)

Speler S₁ kan natuurlijk ook zó gaan redeneren:

- Als speler S₂ strategie y₁ kiest dan is mijn winst 0,2 × 3 + 0,3 × 4 + 0,5 × 1 = 2,3
- Als speler S₂ strategie y₂ kiest dan is mijn winst 0,2 × -1 + 0,3 × 0 + 0,5 × 3 = 1,3
- Als speler S₂ strategie y₃ kiest dan is mijn winst 0,2 × 2 + 0,3 × 1 + 0,5 × 2 =1,7
Als S₂ wat varieert dan weet ik nu wel zeker dat ik minstens 1,3 zal krijgen, want dat is als S₂ 100% strategie y₂ speelt, en als hij die mengt met andere strategieën wordt dat alleen maar beter voor mij.

Zoals je intussen weet was dit een maximin-taktiek.

En omgekeerd kan speler S₂ zó redeneren:

- Als speler S₁ strategie x₁ kiest dan is mijn verlies 0,1 × 3 + 0,2 × -1 + 0,7 × 2 = 1,5
- Als speler S₁ strategie x₂ kiest dan is mijn verlies 0,1 × 4 + 0,2 × 0 + 0,7 × 1 = 1,1
- Als speler S₁ strategie x₃ kiest dan is mijn verlies 0,1 × 1 + 0,2 × 3 + 0,7 × 2 = 2,1
Als S₁ wat varieert dan weet ik nu wel zeker dat ik hoogstens 2,1 zal verliezen, want dat is als S₁ 100% strategie x₃ speelt, en als hij die mengt met andere strategieën wordt dat alleen maar beter voor mij.

Zoals je intussen weet was dit een minimax-taktiek

Maar als ik speler S₁ was, dan zou ik wel even voor allerlei andere vectoren (x₁, x₂, x₃) óók gaan berekenen wat de minimale winst zal zijn, niet alleen maar voor deze ene vector.

Nou, ik ben zo aardig geweest om voor S₁ een Excel-bestand te maken met alle mogelijke variaties van x₁, x₂, en x₃ met stapjes van 0,05 te bekijken.
Het resultaat daarvan staat in de figuur hieronder.

Bovenaan in het oranje staan de kansen x₁
Links in het blauw staan de kansen x₂
(de kans x₃ is dan gelijk aan 1 - x₁ - x₂)
Op de kruising staat de verwachte minimale winst voor S₁.

Je ziet dat de grootste gegarandeerde winst die S₁ kan halen gelijk is aan 1,8.
Dat is hier zo bij de vectoren X(0.10, 0.20, 0.70) of X(0.15, 0.20, 0.65)
Uiteraard zou je daartussen nog meer stapjes in de kansen kunnen nemen om dit nog verder te onderzoeken.
Dan vind je een grootste gegarandeerde winst voor S₁ van 1,8333 (met x₁ = x₂ = 0,1667)

En je voelt het natuurlijk al wel aankomen..... ook S₂ kan zo'n onderzoek verrichten om te kijken wanneer zijn maximale verlies zo klein mogelijk is.
Dat heb ik ook maar even voor hem gedaan, en dat leverde de volgende figuur:

Je ziet dat het kleinste maximale verlies dat S₂ kan halen gelijk is aan 1,85.
Dat is hier zo bij de vector Y(0.30, 0.15, 0.55)
Ook hier zouden we nog verder kunnen "inzoomen" door de kansen in kleinere stapjes te nemen.
Dan vind je een kleinste maximaal verlies van 1,8333 (met y₁ = 0,3333 en y₂ = 0,1666)

Nou ja, Zeg!!!!
Dat is gelijk!!!!
Wat een toeval!

Of zou die matrix A net zo gekozen zijn dat dit zo uitkomt?
Nou ik kan je zeggen: Dat is niet zo. Er komt ALTIJD voor beiden hetzelfde uit.
Als je het niet gelooft (dat deed ik eerst ook niet) probeer het dan maar uit met het Excel-bestand. Dat kun je hier vinden en daar kun je een willekeurige 3´3 matrix A invullen.

En dat is nou precies wat von Neumann met zijn minimax-stelling bewees:

In zero-sum spelen met gemengde strategieën waar spelers minimax-strategieën volgen,
is er altijd een Nash-evenwicht.

Het geniale hiervan zit hem er niet zozeer in dat hij dit ontdekte.

We zagen zelf al dat dat met een beetje Excel wel te vinden is, alhoewel ik eerlijk moet zeggen dat het met meer dan 3 keuzes voor S₁ of S₂ wel veel werk wordt. Maar goed, een beetje computer kan dat wel.

Nee, het geniale zit hem erin dat von Neumann deze stelling bewees in het algemene geval!!!
OK; om dat bewijs te snappen hebben we denk ik een nieuwe les nodig....