Читайте также:
|
|
Пусть игра m × n задана платежной матрицей
.
Игрок A применяет стратегии A 1, A 2,..., Am, а игрок B – стратегии B 1, B 2,..., Bn.
Будем считать, что данная игра не имеет решения непосредственно в чистых стратегиях (нет седловой точки), и, значит, оптимальное решение необходимо искать в области смешанной стратегии.
Смешанными стратегиямиигроков A и B называют векторы P = (p1, p2,…, pm) и Q = (q 1, q 2,..., qn), координаты которых равны вероятностям применения игроками своих чистых стратегий A 1, A 2,..., Am и B 1, B 2,..., Bn соответственно.
События, состоящие в том, что игроки применяют какую-либо из своих чистых стратегий, образуют для каждого игрока полную группу событий. Следовательно, сумма координат векторов P и Q равна единице:
p 1 + p 2+ … + pm = 1,
q 1 + q 2+ … + qn = 1.
Кроме того, по свойству вероятности, для координат смешанных стратегий выполняются неравенства:
i =1,…, m,
j =1,…, n.
Оптимальная стратегия P* обеспечивает игроку A средний выигрыш, не меньший цены игры ν, при любой стратегии игрока B и выигрыш, равный цене игры ν, при оптимальной стратегии Q* игрока B.
Без ограничения общности полагаем далее, что ν > 0. Применяя оптимальную стратегию P* против любой чистой стратегии Qj игрока B, игрок A получает средний выигрыш или математическое ожидание выигрыша
aj = a 1 j p 1 + a 2 j p 2 +... + amj pm ≥ ν.
Таким образом, вычисляя средние выигрыши игрока A для каждой из чистых стратегий игрока B, получаем систему неравенств
.
Разделив каждое из неравенств на цену игры ν и вводя новые переменные
, ,…, ,
получим систему
.
Целевую функцию для игрока A найдем, учитывая, что он стремится получить максимальный выигрыш в игре. Разделив равенство
p 1 + p 2+ … + pm = 1
на цену игры ν, получим
,
которое будет иметь наименьшее значение при достижении игроком A максимального выигрыша. Поэтому в качестве целевой функции можно взять функцию
F (X) = x 1 + x 2 +... + xm
и задачу линейного программирования сформулировать следующим образом: определить значения переменных xi ≥ 0, i =1,…, m, так, чтобы они удовлетворяли линейным ограничениям
(5.1)
и при этом целевая функция F (X) = x 1 + x 2 +... + xm имела минимальное значение.
Решая данную задачу, получаем оптимальную стратегию задачи линейного программирования для которой значение целевой функции равно
F (X*) = min F (X).
Находим цену игры ν:
.
Вычисляем координаты смешанной оптимальной стратегии P* игрока A:
pi = ν xi, i =1,…, m.
Чтобы найти оптимальную стратегию игрока B, составляем двойственную к рассмотренной задачу и решаем ее. Двойственная задача, т.е. задача игрока В имеет ограничения
(5.2)
и целевую функцию Z(Y) = y 1 + y 2 +…+ yn → max.
Решая эту задачу получаем оптимальную стратегию и вычисляем координаты оптимальной смешанной стратегии Q* игрока B:
qi = ν yj, j =1,…, n.
В ходе решения двойственной задачи определяется максимальное значение целевой функции Z (Y*) = max Z (Y), и цена игры может быть определена из равенства
.
Таким образом, найдено оптимальное решение для игры.
Поскольку задачи (5.1) и (5.2) образуют пару двойственных задач, нет необходимости решать обе задачи.
Пример 3. Торговая фирма разработала несколько вариантов плана продажи товаров на предстоящей ярмарке с учетом меняющейся конъюнктуры рынка и спроса покупателей. Получающиеся от возможных сочетаний показатели дохода представлены следующей платежной матрицей
.
Определить оптимальный план продажи товаров.
Решение. Торговая фирма может применить три стратегии продаж П1, П2, П3, а конъюнктура рынка и спрос покупателей – стратегии К1, К2, К3. Обозначим вероятность применения торговой фирмой стратегий П1, П2, П3 как р 1, р 2, р 3, вероятность использования стратегий К1, К2, К3 как q 1, q 2, q 3.
Для первого игрока (торговой фирмы) математическая модель задачи имеет вид:
где .
Для второго игрока (конъюнктуры рынка и спроса покупателей) математическая модель задачи имеет вид:
,
yj ≥ 0, j = 1, 2, 3,
где .
Решая задачу для второго игрока симплекс-методом, получаем:
, .
Цена игры .
Так как , то , , .
Оптимальная стратегия второго игрока .
Стратегию первого игрока найдем, используя метод соответствия переменных исходной и двойственной задачи. Получаем
.
Таким образом, торговая фирма на ярмарке должна придерживаться стратегии , при этом она получит доход не менее денежных единиц.
Дата добавления: 2014-12-20; просмотров: 41 | Поможем написать вашу работу | Нарушение авторских прав |