Типы оградительных сооружений в морском порту: По расположению оградительных сооружений в плане различают волноломы, обе оконечности...
Наброски и зарисовки растений, плодов, цветов: Освоить конструктивное построение структуры дерева через зарисовки отдельных деревьев, группы деревьев...
Топ:
История развития методов оптимизации: теорема Куна-Таккера, метод Лагранжа, роль выпуклости в оптимизации...
Особенности труда и отдыха в условиях низких температур: К работам при низких температурах на открытом воздухе и в не отапливаемых помещениях допускаются лица не моложе 18 лет, прошедшие...
Устройство и оснащение процедурного кабинета: Решающая роль в обеспечении правильного лечения пациентов отводится процедурной медсестре...
Интересное:
Национальное богатство страны и его составляющие: для оценки элементов национального богатства используются...
Аура как энергетическое поле: многослойную ауру человека можно представить себе подобным...
Средства для ингаляционного наркоза: Наркоз наступает в результате вдыхания (ингаляции) средств, которое осуществляют или с помощью маски...
Дисциплины:
|
из
5.00
|
Заказать работу |
Содержание книги
Поиск на нашем сайте
|
|
|
|
К сожалению, решение игры в чистых стратегиях удается найти не так часто, как нам этого хотелось бы (это ведь совсем несложно сделать, и читатель уже в этом убедился). В таких случаях чистые стратегии уступают место смешанным.
Определение. Смешанной стратегией игрока A в игре Г называется вероятность распределения вектора
на множестве чистых стратегий
.
Вероятность
означает, что первый игрок выбирает свою i -ю стратегию с данной вероятностью. Вектор
удовлетворяет нормировочному условию теории вероятностей
.
Определение. Смешанной стратегией игрока B в игре Г называется вероятность распределения вектора
на множестве чистых стратегий
.
Вероятность
означает, что первый игрок выбирает свою j -ю стратегию с данной вероятностью. Вектор
удовлетворяет нормировочному условию теории вероятностей
.
Теорема (основная теорема матричных игр). Всякая матричная игра имеет решение в смешанных стратегиях.
Обозначим через
- множество всех смешанных стратегий первого игрока на множестве A. Мы уже упоминали, что решение игры в смешанных стратегиях существует только тогда, когда не существует решение в чистых стратегиях. Поэтому все вектора p, такие, что один элемент равен 1, а остальные нулю, из множества
мы исключим, так как они равносильны применением игроком чистой стратегии. Аналогично, через
обозначим множество смешанных стратегий второго игрока на множестве B и так же исключим все единичные вектора.
Построим смешанное расширение антагонистической игры.
Определение. Антагонистическая игра

называется смешанным расширением игры Г.
Определение. Решение
игры
называется решением исходной игры Г в смешанных стратегиях. При этом вектор
называется вектором оптимальных смешанных стратегий игроков, а
- выигрышем или значением игры и выполняются условия:
, для
.
Значение игры является математическим ожиданием выигрыша при применении игроками своих оптимальных стратегий
. Это значение легко найти, если известны оптимальные значения векторов распределения вероятностей. Но оптимальные вектора тоже необходимо найти. Рассмотрим различные методы решения матричных игр в смешанных стратегиях.
Решение игр
Решение игры 2х2
Самой простой игрой является игра, в которой каждый из двух игроков имеет по две стратегии. Тогда платежная матрица игры будет иметь две строки и два столбца.
|
|
|
|
|
|
|
|
|
Воспользуемся определением решения игры. Рассмотрим игру сначала с позиции первого игрока. Пусть второй игрок применил свою оптимальную стратегию, а первый – любую, кроме оптимальной. Уже упоминалось, что чистая стратегия не может быть оптимальной, поэтому стратегии
и
нам подходят (они априори не могут быть оптимальными). Воспользуемся левой частью двойного неравенства и математическим ожиданием выигрыша, не забудем и про нормировочное условие. Тогда получим систему из двух неравенств и одного уравнения
, где
,
То есть умножим вектор
сначала на первую строку матрицы, а затем на вторую. Первые два неравенства системы всегда будут выполняться как верные равенства. Тогда система примет вид:

Вычтем второе уравнение из первого, приведем подобные и получим систему из двух уравнений с двумя переменными:
.
Подставляя в первое уравнение выраженное значение для
, получим уравнение:
, приводя подобные, найдем выражение для нахождения
:
,
.
Таким образом, оптимальный вектор распределения вероятностей найден и осталось только найти выигрыш. Для этого необходимо подставить значения вероятностей в первое или второе уравнения системы. Таким образом, решив данную систему, найден вектор оптимального распределения вероятностей второго игрока и выигрыш 
Теперь рассмотрим правую часть двойного неравенства. Первый игрок применяет свою оптимальную стратегию, а второй любую, кроме оптимальной, например чистые
и
. Воспользуемся правой частью двойного неравенства и математическим ожиданием выигрыша, не забудем и про нормировочное условие. Тогда получим систему из двух неравенств и одного уравнения
, где
,
на этот раз умножаем вектор
на столбцы матрицы. Первые два неравенства системы всегда будут выполняться как верные равенства. Тогда система примет вид:

Вычтем второе уравнение из первого, приведем подобные и получим систему из двух уравнений с двумя переменными:
,
Подставляя в первое уравнение выраженное значение для
получим уравнение:
, приводя подобные, найдем выражение для нахождения
:
,
.
Таким образом, оптимальный вектор распределения вероятностей первого игрока найден и осталось только найти выигрыш. Для этого надо подставить значения вероятностей в первое или второе уравнение системы. Таким образом, решив данную систему найден вектор оптимального распределения вероятностей второго игрока и выигрыш 
Так как в условии в общем виде решения игры, когда оба игрока применяют свои оптимальные стратегии, одинаково, то и выигрыш при решении обоих систем должен быть одинаковым. Это условие и будет проверкой правильности решения задачи.
Пример. Найти решение игры 2х2
.
Решение. Эта игра не имеет решение в чистых стратегиях, так как
. Значит, в соответствии с основной теоремой матричных игр, она должна иметь решение в смешанных стратегиях. Рассуждения аналогичны решению задачи в общем виде, поэтому они приводиться еще раз не будут, запишем сразу системы:
.
Вычтем из первых строк вторые и приведем подобные:


.
Выигрыши в обоих случаях совпали, значит задача решена правильно.
Ответ:
.
Задачи для самостоятельного решения.
Решить игру 2х2:
1. 2. 3. 4.

5. 6. 7. 8.

9. 10. 11. 12.

13. 14. 15. 16.

17. 18. 19. 20.

Принцип доминирования
Матрицы размерностью 2х2 встречаются не так часто, как нам того бы хотелось, поэтому рассмотрим принцип, позволяющий уменьшить размерность матрицы.
Первый игрок стремиться максимизировать свой выигрыш и ему будет выгодна та стратегия, которая принесет больший выигрыш. Если элементы некоторой строки платежной матрицы С меньше соответствующих элементов другой строки, то интуитивно ясно, первую можно вычеркнуть. Сформулируем условия доминирования строк и столбцов платежной матрицы, позволяющие уменьшить ее размерность.
Определение. Вектор
доминирует вектор
, если все элементы вектора x больше или равны соответствующим элементам вектора y. То есть
, и хотя бы одно неравенство выполняется как строгое. Про вектор y говорят, что он доминируется вектором x.
Определение. Линейная комбинация векторов
называется выпуклой, если существуют такие коэффициенты
, не равные нулю одновременно, что выполнено условие 
Теорема (о доминировании строк). Если в игре с платежной матрицей С какая-либо строка доминируется выпуклой комбинацией остальных строк, то она будет входить с нулевой вероятностью в оптимальную смешанную стратегию первого игрока и ее можно вычеркнуть.
Замечания к теореме:
1. Если в матрице существуют несколько одинаковых срок, то все, кроме одной можно вычеркнуть, и они будут входить с нулевой вероятностью в оптимальную смешанную стратегию первого игрока.
2. Если какая-либо строка доминируется другой, то меньшую можно вычеркнуть.
Теорема (о доминировании столбцов). Если в игре с платежной матрицей C какой-либо столбец доминирует выпуклую комбинацию остальных столбцов, то он будет входить с нулевой вероятностью в оптимальную смешанную стратегию второго игрока и его можно вычеркнуть.
Пример Используя принцип доминирования найти оптимальную стратегию.

Решение. Третий и четвертый столбец доминируют над вторым, поэтому, в соответствии с утверждением о доминировании строк, их можно вычеркнуть и они будут входить с нулевой вероятностью в оптимальную смешанную стратегию второго игрока.
Из оставшихся трех строк и двух столбцов, можно вычеркнуть первую строку, так как она доминируется третьей строкой. Оставшуюся игру 2х2 просто решить. Таким образом, оптимальными смешанными стратегиями игроков будут:
,
,
.
Задачи для самостоятельного решения.
Используя принцип доминировании, решить игру:
1. 2. 3.

4. 5. 6.

7. 8. 9.

10. 11. 12.

|
|
|
Историки об Елизавете Петровне: Елизавета попала между двумя встречными культурными течениями, воспитывалась среди новых европейских веяний и преданий...
Биохимия спиртового брожения: Основу технологии получения пива составляет спиртовое брожение, - при котором сахар превращается...
Папиллярные узоры пальцев рук - маркер спортивных способностей: дерматоглифические признаки формируются на 3-5 месяце беременности, не изменяются в течение жизни...
Организация стока поверхностных вод: Наибольшее количество влаги на земном шаре испаряется с поверхности морей и океанов (88‰)...
© cyberpediasu.com 2017-2026 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!