Вирішення ігор в змішаних стратегіях.
Якщо гра не має сідловок точки, то застосування чистих стратегій не дає оптимального вирішення гри. У такому разі можна отримати оптимальне рішення, випадковим чином чергуючи чисті стратегії.
Змішаною стратегією SA гравця А називається застосування чистих стратегій А1, А2.,Аi,.Аm з вірогідністю p1, p2.,pi,.pm, причому сума вірогідності рівна 1:. Змішані стратегії гравця записуються у вигляді матриці:
або у вигляді рядка. Аналогічно змішані стратегії гравця В позначаються:
або
, де сума вірогідності появи стратегій гравця В рівна 1:
.
Чисті стратегії можна вважати окремим випадком змішаних і задавати рядком з нулів і одиниці, причому одиниця повинна стояти в позиції, відповідній чистій стратегії.
На підставі принципу мінімакса визначається оптимальне вирішення гри: це пара оптимальних стратегій, у загальному випадку змішаних, таких, що володіють наступною властивістю: якщо один з гравців дотримується своєї оптимальної стратегії, то іншому не може бути вигідно відступати від своєї оптимальної стратегії. Виграш, відповідною оптимальному рішенню, називається ціною гри
. Ціна гри задовольняє нерівності:
, де
- нижня ціна гри;
- верхня.
Теорема Неймана: кожна кінцева гра має принаймні одне оптимальне рішення, можливо, серед змішаних стратегій.
Якщо чиста стратегія входить в оптимальну змішану стратегію з вірогідністю, відмінною від нуля, то вона називається активною.
Теорема про активні стратегії: якщо один з гравців дотримується своєї оптимальної змішаної стратегії, то виграш залишається незмінним і рівний ціні гри
, якщо другий гравець не виходить за межі своїх активних стратегій.
Нехай задана платіжна матриця гри:
![]()
Середній виграш гравця А, якщо він використовує оптимальну змішану стратегію, а гравець В чисту стратегію (відповідає першому стовпцю платіжної матриці Р), рівний ціні гри
:
![]()
Той же середній виграш отримає гравець А, якщо гравець У вибере стратегію, тобто:
. Враховуючи, що
, отримаємо систему рівнянь для визначення оптимальної стратегії
і ціни гри
:
![]()
Вирішуючи цю систему отримаємо оптимальну стратегію і ціну гри :
Використовуючи теорему про активні стратегії - оптимальну стратегію гравця В, отримуємо, що при будь-якій чистій стратегії гравця А (або
) середній програш гравця В рівний ціні гри
:
Вирішуючи цю систему отримаємо оптимальну стратегію і ціну гри: