Смешанной стратегией SA игрока А называется применение чистых стратегий A1, A2, ..., Am с вероятностями p1, p2, ..., pi, ..., pm причем сумма вероятностей равна 1: Смешанные стратегии игрока Азаписываются в виде матрицы
или в виде строки SA = (p1, p2, ..., pi, ..., pm) Аналогично смешанные стратегии игрока В обозначаются:
, или,
SB = (q1, q2, ..., qi, ..., qn),
где сумма вероятностей появления стратегий равна 1:
Чистые стратегии можно считать частным случаем смешанных и задавать строкой, в которой 1 соответствует чистой стратегии. На основании принципа минимакса определяется оптимальное решение (или решение) игры: это пара оптимальных стратегий S*A, S*B в общем случае смешанных, обладающих следующим свойством: если один из игроков придерживается своей оптимальной стратегии, то другому не может быть выгодно отступать от своей. Выигрыш, соответствующий оптимальному решению, называется ценой игры v. Цена игры удовлетворяет неравенству: α ≤ v ≤ β
где α и β — нижняя и верхняя цены игры. Справедлива следующая основная теорема теории игр — теорема Неймана. Каждая конечная игра имеет по крайней мере одно оптимальное решение, возможно, среди смешанных стратегий. Пусть S*A = (p*1, p*2, ..., p*i, ..., p*m) и S*B = (q*1, q*2, ..., q*i, ..., q*n) — пара оптимальных стратегий.
Рассмотрение методов нахождения оптимальных смешанных стратегий для матричных игр начнем с простейшей игры, описываемой матрицей 2х2. Смешанные стратегии записываются так:
Значит, имеется платежная матрица
При этом
откуда получаем оптимальные значения p01 и p02:
Зная p01 и p02: находим g:
Вычислив g, находим q01 и q02:
Задача решена, так как найдены векторыт и цена игры g. Имея матрицу платежей А, можно решить задачу графически. При этом методе алгоритм решения весьма прост (рис. 2.1):
1. По оси абсцисс откладывается отрезок единичной длины.
2. По оси ординат откладываются выигрыши при стратегии А1.
3. На линии, параллельной оси ординат, в точке 1 откладываются выигрыши при стратегии А2.
4. Концы отрезков обозначаются для a11 – b11, a12 – b21, a22 – b22, a21 – b12 и проводятся две прямые линии b11 b12и b21 b22.
5. Определяется ордината точки пересечения с. Она равна g. Абсцисса точки с равна р2 (р1 = 1 – р2).
Рис. 2.1. Оптимальная смешанная стратегия
Это основано на общем свойстве игр т´п, состоящем в том, что в любой игре т´п каждый игрок имеет оптимальную смешанную стратегию, в которой число чистых стратегий не больше, чем min(m,n). Из этого свойства можно получить известное следствие: в любой игре 2´п и т´2 каждая оптимальная стратегия S01 и S02 содержит не более двух активных стратегий. Значит, любая игра 2´n и т´2 может быть сведена к игре 2´2. Следовательно, игры 2´т и т´2 можно решить графическим методом.
Ситуация конфликта и теория игр. Основные понятия теории игр: игра с нулевой суммой, седловая точка и цена игры.
Предметом теории игр являются такие ситуации, в которых важную роль играют конфликты и совместные действия.
Конфликт может возникнуть в результате различия целей которые отражают не только несовпадающие интересы разных сторон, но и многочисленные интересы одного и того же лица. Например, ЛПР, формирующее экономическую политику фирмы, обычно преследует разнообразные цели, выдвигая противоречивые требования, предъявляемые к ситуации (рост объемов производства, повышение доходов, снижение экологической нагрузки и т. п.). Конфликт также может быть результатом действия тех или иных «стихийных сил», то есть внешнего окружения. Поэтому математическая модель, адекватно отражающая: любое социально-экономическое явление, должна отражать присущие ему черты конфликта, то есть описывать:
- множество заинтересованных сторон; в теории игр они называются игроками;
- возможные действия каждой из сторон, которые называются стратегиями, или ходами;
- интересы сторон, представляемые функциями выигрыши платежной матрицей
В теории игр предполагается, что функции выигрыша и множество стратегий, доступных каждому из игроков, общеизвестны то есть каждый игрок знает свою функцию выигрыша и набор I имеющихся в его распоряжении стратегий, а также функции выигрыша и стратегии остальных игроков, и в соответствии с : информацией организовывает свое поведение.
Различные виды игр можно классифицировать по различным признакам. К ним относятся:
- число игроков;
- число стратегий;
- свойства функции выигрыша;
- возможность предварительных переговоров и взаимодействия между игроками в ходе игры.
Игра называется игрой с нулевой суммой, если одна сторона выигрывает то, что проигрывает другая, т. е. сумма выигрышей К и С равна нулю.
В результате борьбы интересов, если оба противника одинаково разумны, по-видимому, должно быть найдено некоторое равновесное положение, при котором каждый игрок получит то, что ему причитается,— не больше и не меньше. Этот равновесный средний выигрыш, на который вправе рассчитывать игрок К, если обе стороны будут вести с разумно, т. е. придерживаться своих оптимальных (наилучших) стратегий, называется ценой игры.
В матрице имеется особый элемент ; он является минимальным в своей строке и одновременно максимальным в своем столбце. Такой элемент называется седловой точкой.