Студопедия
Главная страница | Контакты | Случайная страница

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатика
ИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханика
ОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторика
СоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансы
ХимияЧерчениеЭкологияЭкономикаЭлектроника

Решение игр в смешанных стратегиях

Читайте также:
  1. E) прокурором утвержден протокол об уголовном проступке и принято решение о направлении уголовного дела в суд
  2. V. Решение задач (12мин) Слайд9
  3. Активация ресурсов клиента в процессе работы с ним (решение-ориентированное консультирование).
  4. Анализ и решение
  5. Виктор Шаталов: Проблема расово смешанных браков для современной России
  6. ВОПРОС 37/38. (37) ГРАФИЧЕСКИЕ СИСТЕМЫ САПР И РЕШЕНИЕ ГРАФИЧЕСКИХ ЗАДАЧ .(38)КЛАССИФИКАЦИЯ И ОБЩИЕ ПРИНЦИПЫ ПОСТРОЕНИЯ ГРАФИЧЕСКИХ СИСТЕМ САПР.
  7. Вопрос 50. Решение земельного вопроса по реформе 1861года и реформе Столыпина.
  8. Воскрешение Лазаря.
  9. Г) перегруженность руководства оперативным решением проблем.
  10. Глава 3. Разрешение конфликтных ситуаций

Если игра не имеет седловой точки, то применение чистых стратегий не даёт оптимального решения игры. Так в задаче 1 a ¹ b, седловая точка отсутствует. В таком случае можно получить оптимальное решение, случайным образом чередуя чистые стратегии.

Смешанной стратегией Sa игрока А называется применение чистых стратегий A1, A2, …, Ai, …, Am с вероятностями p1, p2, …, pi, …, pm, причём

сумма вероятностей равна 1: . Смешанные стратегии игрока А записываются в виде матрицы

или в виде строки SA = (p1, p2, …, pi, …, pm). Аналогично смешанные стратегии игрока В обозначаются:

, или SB = (q1, q2, …, qj, …, qn),

где сумма вероятностей появления стратегий равна 1: .

Чистые стратегии можно считать частным случаем смешанных и задавать строкой, в которой 1 соответствует чистой стратегии. На основании принципа минимакса определяется оптимальное решение (или решение) игры: это пара оптимальных стратегии SA*, SB* в общем случае смешанных, обладающих следующим свойством: если один из игроков придерживается своей оптимальной стратегии, то другому не может быть выгодно отступать от своей. Выигрыш, соответствующий оптимальному решению, называется ценой игры n. Цена игры удовлетворяет неравенству:

a £ n £ b,

где a и b - нижняя и верхняя цена игры.

Справедлива следующая основная теорема теории игр – теорема Неймана. Каждая конечная игра имеет по крайней мере одно оптимальное решение, возможно, среди смешанных стратегий.

Пусть SA* = (p1*, p2*,…,рm*) и SB* = (q1*, q2*, … qn*) – пара оптимальных стратегий. Если чистая стратегия входит в оптимальную смешанную стратегию с отличной от нуля вероятностью, то она называется активной.

Справедлива теорема об активных стратегиях: если один из игроков придерживается своей оптимальной смешанной стратегии, то выигрыш остаётся неизменным и равным цене игры n, если второй игрок не входит за пределы своих активных стратегий.

Эта теорема имеет большое практическое значение – она даёт конкретные модели нахождения оптимальных стратегий при отсутствии седловой точки.

Рассмотрим игру размера 2×2, которая является простейшим случаем конечной игры. Если такая игра имеет седловую точку, то оптимальное решение – это пара чистых стратегий, соответствующих этой точке.

Игра, в которой отсутствует седловая точка, в соответствии с основной теоремой теории игр оптимальное решение существует и определяется парой смешанных стратегий SA* = (p1*, p2*) и SB* = (q1*, q2*).

Для того чтобы их найти, воспользуемся теоремой об активных стратегиях. Если игрок А придерживается своей оптимальной стратегии SA*, то его средний выигрыш будет равен цене игры n, какой бы активной стратегией ни пользовался игрок В. Для игры 2×2 любая чистая стратегия противника является активной, если отсутствует седловая точка. Выигрыш игрока А (проигрыш игрока В) – случайная величина, математическое ожидание (среднее значение) которой является ценой игры. Поэтому средний выигрыш игрока А (оптимальная стратегия) будет равна n и для 1-й, и для 2-й стратегии противника.

Пусть игра задана платёжной матрицей

Средний выигрыш игрока А, если он использует оптимальную смешанную стратегию , а игрок В – чистую стратегию В1 (это соответствует 1-му столбцу платёжной матрицы Р), равен цене игры n:

a11p1* = a21p2* =n.

Тот же выигрыш получает игрок А, если 2-й игрок применяет стратегию В2, т.е. а12р1* = а22р2* = n. Учитывая, что р1* + р2* = 1, получаем систему уравнений для определения оптимальной стратегии SA* и цены игры n:

(1)

Решая эту систему, получим оптимальную стратегию

,

и цену игры

.

Применяя теорему об активных стратегиях при отыскании SB* -оптимальной стратегии игрока В, получаем, что при любой чистой стратегии игрока А (А1 или А2) средний проигрыш игрока В равен цене игры n, т.е.

 

(2)

 

тогда оптимальная стратегия SB* (q1*,q2*) определяется формулами:

,

 




Дата добавления: 2015-04-11; просмотров: 81 | Поможем написать вашу работу | Нарушение авторских прав

1 | 2 | <== 3 ==> |


lektsii.net - Лекции.Нет - 2014-2025 год. (0.648 сек.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав