Читайте также:
|
|
Пусть мы имеем m возможных состояний природы (какое из них наступит, заранее неизвестно) и n стратегий собственного поведения (одну из них мы должны выбрать заранее). Например, мы должны взять с собой зонт, или не брать его, а погода может иметь два состояния – пойдет дождь, или не пойдет. В результате выбора стратегии Si и реализации состояния природы Pj получается результат Rij. Все возможные случаи можно представить в виде следующей матрицы
Состояния природы | P1 | P2 | Pj | Pm |
Выбранная стратегия | ||||
S1 | R11 | R12 | R1m | |
S2 | R21 | R22 | R2m | |
Si | Ri1 | Ri2 | Rij | Rim |
Sn | Rn1 | Rn2 | Rnm |
Договоримся, что результат Rij можно измерить и нам выгоден максимальный результат.
Могут представиться следующие ситуации:
1. Известны вероятности наступления всех состояний природы pj для Pj. В этом случае надо подсчитать математическое ожидание суммы результатов для каждой стратегии MRi=Σpj*Rij. Стратегия, давшая максимальный результат, может быть выбрана в качестве выйгрышной.
2. Вероятности наступления всех состояний природы неизвестны. Тогда возможны три ситуации:
А) Вальд. Позиция пессимиста - природа злонамеренна и все делает нам на зло. В ответ на любую стратегию она выбирает состояние с минимальным значением Rij. Нам остается из этих минимальных значений выбрать максимальное значение. Таким образом оптимальную стратегию определяет элемент платежной матрицы, выбираемый с помощью алгоритма: max (в столбце минимумов по i) min (в каждой строке по j). max min Rij
Сначала отыскиваются минимумы по строкам, затем среди столбца найденных минимумов отыскивается максимум.
Б) Позиция оптимиста – природа всегда идет нам навстречу. При любой выбранной стратегии состояние природы соответствует максимуму Rij.
В этом случае в каждой строке-стратегии выбирается максимальное значение Rij и затем среди столбца максимумов опять выбирается максимум.
Алгоритм – max (в столбце максимумов по i) min (в каждой строке по j).
max max Rij
В) Гурвиц. Промежуточный случай между безудержным пессимизмом и оптимизмом
max (λ minRij+(1- λ) maxRij), где λ вероятность злонамеренности природы.
3. Сэвидж. Мы боимся упустить большой выйгрыш. В этом случае алгоритм состоит из трех шагов.
Первый шаг. В каждой строке находим максимальный выйгрыш и строим матрицу рисков rij=maxRij-Rij
Второй шаг. В каждой строке матрицы рисков находим max rij.
Третий шаг. Среди столбца максимумов находим минимальный min max rij.
Таким образом получается решение с минимальным риском.
Дата добавления: 2015-01-12; просмотров: 24 | Поможем написать вашу работу | Нарушение авторских прав |