|
|||||
Gemengde strategieën. | |||||
Stel nou dat Spelers 1 en 2 beiden niet voor één strategie kiezen, maar dat zij elke strategie met een bepaalde kans gaan kiezen, en dat die kansen vooraf bekend zijn. Dat noemen we dan een gemengde strategie. | |||||
Voorbeeld. Voor een bepaald spel geldt de volgende matrix: |
|||||
|
|||||
(Controleer zelf even
dat er geen dominerende rijen of kolommen zijn) Stel verder dat spelers S1 zijn 4 mogelijke strategieën kiest met waarschijnlijkheid 0,1 - 0,3 - 0,4 - 0,2 (respectievelijk) Stel dat speler S2 zijn 3 mogelijke strategieën kiest met waarschijnlijkheid 0,3 - 0,2 - 0,5 Merk even op dat de som van al die kansen beide keren gelijk is aan 1. Dan kunnen we de verwachtingswaarde van de winst voor speler 1 uitrekenen: Als S1 strategie 1 kiest wint hij gemiddeld 0,3 · 3 + 0,2 · 3 + 0,5 · 1 = 2,0 Als S1 strategie 2 kiest wint hij gemiddeld: 0,3 · 2 + 0,2 · 4 + 0,5 · 1 = 1,9 Als S1 strategie 3 kiest wint hij gemiddeld 0,3 · -1 + 0,2 · 2 + 0,5 · 2 = 1,1 Als S1 strategie 4 kiest wint hij gemiddeld 0,3 · 4 + 0,2 · 0 + 0,5 · 3 = 2,7 Over alle strategieën samen zal S1 gemiddeld 0,1 · 2,0 + 0,3 · 1,9 + 0,4 · 1,1 + 0,2 · 2,7 = 1,75 winnen. Wat hebben we hier wiskundig gedaan? De kansen op de strategieën worden voor beide spelers gegeven. Stel dat (x1, x2, ...xn) de kansen op de n mogelijke strategieën van S1 zijn, en (y1, y2, ..., ym) de kansen op de m mogelijke strategieën van S2. Dan kunnen we die kansen als twee kolomvectoren weergeven: |
|||||
|
|||||
Voor de verwachtingswaarde van de winst voor S1 moeten we alle elementen van de spelmatrix A vermenigvuldigen met de bijbehorende kansen. Dat ziet er dus zó uit: | |||||
|
|||||
Die somtekens zorgen er samen voor dat alle elementen aij worden langsgelopen. | |||||
Als matrixvermenigvuldiging zou je het zó kunnen noteren: | |||||
|
|||||
Of, nog korter: | |||||
|
|||||
(Met XT
wordt bedoeld de getransponeerde matrix X; dat is de matrix die je
krijgt als je alle rijen en kolommen van X verwisselt) Voor zulke gemengde strategieën spreken we opnieuw af wat we met een Nash-Evenwicht bedoelen: |
|||||
|
|||||
Daarin is u
de verwachting voor speler 1. (Als er geen sprake is van een zero-sum spel dan moeten we de u's vervangen door u1 voor S1 en u2 voor S2) |
|||||
© h.hofstede (h.hofstede@hogeland.nl) |