Студопедия  
Главная страница | Контакты | Случайная страница

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатика
ИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханика
ОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторика
СоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансы
ХимияЧерчениеЭкологияЭкономикаЭлектроника

Решение матричных игр симплексным методом

Читайте также:
  1. GІІ.Излагаете проблему группе. Вместе со всеми вырабатываете решение на основе консенсуса. Выполняете любое решение группы.
  2. I. Решение логических задач средствами алгебры логики
  3. II Разрешение практических ситуаций с использованием возможностей справочных правовых систем
  4. а затем полное обоснованное решение и ответ
  5. Алгоритм тестирования НГМД методом записи-чтения со сравнением.
  6. Аналіз ряду динаміки методом вирівнювання за середнім абсолютним приростом
  7. В 1878 г. учение Фомы Аквинского решением Папы Римского было объявлено официальной идеологией католицизма.
  8. В чем заключается отличие признания брака недействительным от расторжения брака? Какое решение должен вынести суд?
  9. ВОПРОС 4. Социальное управление как разрешение противоречия между управляющей и управляемой системами
  10. Временная остановка кровотечения методом наложения кровоостанавливающего жгута Эсмарха

 

Пусть игра m × n задана платежной матрицей

.

Игрок A применяет стратегии A 1, A 2,..., Am, а игрок B – стратегии B 1, B 2,..., Bn.

Будем считать, что данная игра не имеет решения непосредственно в чистых стратегиях (нет седловой точки), и, значит, оптимальное решение необходимо искать в области смешанной стратегии.

Смешанными стратегиямиигроков A и B называют векторы P = (p1, p2,…, pm) и Q = (q 1, q 2,..., qn), координаты которых равны вероятностям применения игроками своих чистых стратегий A 1, A 2,..., Am и B 1, B 2,..., Bn соответственно.

События, состоящие в том, что игроки применяют какую-либо из своих чистых стратегий, образуют для каждого игрока полную группу событий. Следовательно, сумма координат векторов P и Q равна единице:

p 1 + p 2+ … + pm = 1,

q 1 + q 2+ … + qn = 1.

Кроме того, по свойству вероятности, для координат смешанных стратегий выполняются неравенства:

i =1,…, m,

j =1,…, n.

Оптимальная стратегия P* обеспечивает игроку A средний выигрыш, не меньший цены игры ν, при любой стратегии игрока B и выигрыш, равный цене игры ν, при оптимальной стратегии Q* игрока B.

Без ограничения общности полагаем далее, что ν > 0. Применяя оптимальную стратегию P* против любой чистой стратегии Qj игрока B, игрок A получает средний выигрыш или математическое ожидание выигрыша

aj = a 1 j p 1 + a 2 j p 2 +... + amj pm ≥ ν.

Таким образом, вычисляя средние выигрыши игрока A для каждой из чистых стратегий игрока B, получаем систему неравенств

.

Разделив каждое из неравенств на цену игры ν и вводя новые переменные

, ,…, ,

получим систему

.

Целевую функцию для игрока A найдем, учитывая, что он стремится получить максимальный выигрыш в игре. Разделив равенство

p 1 + p 2+ … + pm = 1

на цену игры ν, получим

,

которое будет иметь наименьшее значение при достижении игроком A максимального выигрыша. Поэтому в качестве целевой функции можно взять функцию

F (X) = x 1 + x 2 +... + xm

и задачу линейного программирования сформулировать следующим образом: определить значения переменных xi ≥ 0, i =1,…, m, так, чтобы они удовлетворяли линейным ограничениям

(5.1)

и при этом целевая функция F (X) = x 1 + x 2 +... + xm имела минимальное значение.

Решая данную задачу, получаем оптимальную стратегию задачи линейного программирования для которой значение целевой функции равно

F (X*) = min F (X).

Находим цену игры ν:

.

Вычисляем координаты смешанной оптимальной стратегии P* игрока A:

pi = ν xi, i =1,…, m.

Чтобы найти оптимальную стратегию игрока B, составляем двойственную к рассмотренной задачу и решаем ее. Двойственная задача, т.е. задача игрока В имеет ограничения

(5.2)

и целевую функцию Z(Y) = y 1 + y 2 +…+ yn → max.

Решая эту задачу получаем оптимальную стратегию и вычисляем координаты оптимальной смешанной стратегии Q* игрока B:

qi = ν yj, j =1,…, n.

В ходе решения двойственной задачи определяется максимальное значение целевой функции Z (Y*) = max Z (Y), и цена игры может быть определена из равенства

.

Таким образом, найдено оптимальное решение для игры.

Поскольку задачи (5.1) и (5.2) образуют пару двойственных задач, нет необходимости решать обе задачи.

Пример 3. Торговая фирма разработала несколько вариантов плана продажи товаров на предстоящей ярмарке с учетом меняющейся конъюнктуры рынка и спроса покупателей. Получающиеся от возможных сочетаний показатели дохода представлены следующей платежной матрицей

.

Определить оптимальный план продажи товаров.

Решение. Торговая фирма может применить три стратегии продаж П1, П2, П3, а конъюнктура рынка и спрос покупателей – стратегии К1, К2, К3. Обозначим вероятность применения торговой фирмой стратегий П1, П2, П3 как р 1, р 2, р 3, вероятность использования стратегий К1, К2, К3 как q 1, q 2, q 3.

Для первого игрока (торговой фирмы) математическая модель задачи имеет вид:

где .

Для второго игрока (конъюнктуры рынка и спроса покупателей) математическая модель задачи имеет вид:

,

yj ≥ 0, j = 1, 2, 3,

где .

Решая задачу для второго игрока симплекс-методом, получаем:

, .

Цена игры .

Так как , то , , .

Оптимальная стратегия второго игрока .

Стратегию первого игрока найдем, используя метод соответствия переменных исходной и двойственной задачи. Получаем

.

Таким образом, торговая фирма на ярмарке должна придерживаться стратегии , при этом она получит доход не менее денежных единиц.




Дата добавления: 2014-12-20; просмотров: 41 | Поможем написать вашу работу | Нарушение авторских прав




lektsii.net - Лекции.Нет - 2014-2024 год. (0.008 сек.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав