Что такое оптимальные стратегии
Теория игр: принятие решений с примерами на Kotlin
Теория игр — математическая дисциплина, рассматривающая моделирование действий игроков, которые имеют цель, заключающуюся в выбор оптимальных стратегий поведения в условиях конфликта. На Хабре эта тема уже освещалась, но сегодня мы поговорим о некоторых ее аспектах подробнее и рассмотрим примеры на Kotlin.
Так вот, стратегия – это совокупность правил, определяющих выбор варианта действий при каждом личном ходе в зависимости от сложившейся ситуации. Оптимальная стратегия игрока – стратегия, обеспечивающая наилучшее положение в данной игре, т.е. максимальный выигрыш. Если игра повторяется неоднократно и содержит, кроме личных, случайные ходы, то оптимальная стратегия обеспечивает максимальный средний выигрыш.
Задача теории игр – выявление оптимальных стратегий игроков. Основное предположение, исходя из которого находятся оптимальные стратегии, заключается в том, что противник (или противники) не менее разумен, чем сам игрок, и делает все для того, чтобы добиться своей цели. Расчет на разумного противника – лишь одна из потенциальных позиций в конфликте, но в теории игр именно она кладется в основу.
Существуют игры с природой в которых есть только один участник, максимизирующий свою прибыль. Игры с природой – математические модели, в которых выбор решения зависит об объективной действительности. Например, покупательский спрос, состояние природы и т.д. «Природа» – это обобщенное понятие не преследующего собственных целей противника. В таком случае для выбора оптимальной стратегии используется несколько критериев.
Различают два вида задач в играх с природой:
Сейчас мы рассмотрим критерии принятия решений в чистых стратегиях, а в конце статьи решим игру в смешанных стратегиях аналитическим методом.
Постановка задачи
Все критерии принятия решений мы разберем на сквозном примере. Задача такова: фермеру необходимо определить, в каких пропорциях засеять свое поле тремя культурами, если урожайность этих культур, а, значит, и прибыль, зависят от того, каким будет лето: прохладным и дождливым, нормальным, или жарким и сухим. Фермер подсчитал чистую прибыль с 1 гектара от разных культур в зависимости от погоды. Игра определяется следующей матрицей:
Далее эту матрицу будем представлять в виде стратегий:
Искомую оптимальную стратегию обозначим . Решать игру будем с помощью критериев Вальда, оптимизма, пессимизма, Сэвиджа и Гурвица в условиях неопределенности и критериев Байеса и Лапласа в условиях риска.
Как и говорилось выше примеры будут на Kotlin. Замечу, что вообще-то существуют такие решения как Gambit (написан на С), Axelrod и PyNFG (написанные на Python), но мы будем ехать на своем собственном велосипеде, собранном на коленке, просто ради того, чтобы немного потыкать стильный, модный и молодежный язык программирования.
Чтобы программно реализовать решение игры заведем несколько классов. Сначала нам понадобится класс, позволяющий описать строку или столбец игровой матрицы. Класс крайне простой и содержит список возможных значений (альтернатив или состояний природы) и соответствующего им имени. Поле key будем использовать для идентификации, а также при сравнении, а сравнение понадобится при реализации доминирования.
Игровая матрица содержит информацию об альтернативах и состояниях природы. Кроме того в ней реализованы некоторые методы, например нахождение доминирующего множества и чистой цены игры.
Опишем интерфейс, соответствующий критерию
Принятие решений в условиях неопределенности
Принятие решений в условиях неопределённости предполагает, что игроку не противостоит разумный противник.
Критерий Вальда
Использование критерия страхует от наихудшего результата, но цена такой стратегии – потеря возможности получить наилучший из возможных результатов.
Рассмотрим пример. Для стратегий найдем минимумы и получим следующую тройку
. Максимумом для указанной тройки будет являться значение 1, следовательно, по критерию Вальда выигрышной стратегией является стратегия
, соответствующая посадке Культуры 2.
Программная реализация критерия Вальда незатейлива:
Для большей понятности в первый раз покажу, как решение выглядело бы в виде теста:
Критерий оптимизма
Стратегия оптимиста может привести к отрицательным последствиям, когда максимальное предложение совпадает с минимальным спросом – фирма может получить убытки при списании нереализованной продукции. В тоже время стратегия оптимиста имеет определённый смысл, например, не нужно заботиться о неудовлетворённых покупателях, поскольку любой возможный спрос всегда удовлетворяется, поэтому нет нужды поддерживать расположения покупателей. Если реализуется максимальный спрос, то стратегия оптимиста позволяет получить максимальную полезность в то время, как другие стратегии приведут к недополученной прибыли. Это даёт определённые конкурентные преимущества.
Рассмотрим пример. Для стратегий найдем найдем максимум и получим следующую тройку
. Максимумом для указанной тройки будет являться значение 5, следовательно, по критерию оптимизма выигрышной стратегией является стратегия
, соответствующая посадке Культуры 1.
Реализация критерия оптимизма почти не отличается от критерия Вальда:
Критерий пессимизма
Критерий пессимизма предполагает, что развитие событий будет неблагоприятным для лица, принимающего решение. При использовании этого критерия лицо принимающее решение ориентируется на возможную потерю контроля над ситуацией, поэтому, старается исключить потенциальные риски выбирая вариант с минимальной доходностью.
После знакомства с критериями Вальда и оптимизма то, как будет выглядеть класс критерия пессимизма, думаю, легко догадаться:
Критерий Сэвиджа
Критерий Сэвиджа (критерий сожалеющего пессимиста) предполагает минимизацию наибольшей потерянной прибыли, иными словами минимизируется наибольшее сожаление по потерянной прибыли:
В данном случае S — это матрица сожалений.
Оптимальное решение по критерию Сэвиджа должно давать наименьшее сожаление из найденных на предыдущем шаге решения сожалений. Решение, соответствующее найденной полезности, будет оптимальным.
К особенностям полученного решения относятся гарантированное отсутствие самых больших разочарований и гарантированное снижение максимальных возможных выигрышей других игроков.
Рассмотрим пример. Для стратегий составим матрицу сожалений:
Тройка максимальных сожалений . Минимальным значением из указанных рисков будет являться значение 4, которое соответствует стратегиям
и
.
Запрограммировать критерий Сэвиджа немного сложнее:
Критерий Гурвица
Критерий Гурвица является регулируемым компромиссом между крайним пессимизмом и полным оптимизмом:
A(0) — стратегия крайнего пессимиста, A(k) — стратегия полного оптимиста, — задаваемое значение весового коэффициента:
;
— крайний пессимизм,
— полный оптимизм.
При небольшом числе дискретных стратегий, задавая желаемое значение весового коэффициента , а затем округлять получаемый результат до ближайшего возможного значения с учётом выполненной дискретизации.
Рассмотрим пример. Для стратегий . Примем, что коэффициент оптимизма
. Теперь составим таблицу:
Максимальным значением из рассчитанных H будет являться значение 3, которое соответствует стратегии .
Реализация критерия Гурвица уже более объемная:
Принятие решений в условиях риска
Методы принятия решений могут полагаться на критерии принятия решений в условиях риска при соблюдении следующих условий:
Критерий ожидаемого значения может быть сведен либо к максимизации ожидаемой (средней) прибыли, либо к минимизации ожидаемых затрат. В данном случае предполагается, что связанная с каждым альтернативным решением прибыль (затраты) является случайной величиной.
Постановка таких задач как правило такова: человек выбирает какие-либо действия в ситуации, где на результат действия влияют случайные события. Но игрок имеет некоторые знания о вероятностях этих событий и может рассчитать наиболее выгодную совокупность и очередность своих действий.
Чтобы можно было и дальше приводить примеры, дополним игровую матрицу вероятностями:
Для того, чтобы учесть вероятности придется немного переделать класс, описывающий игровую матрицу. Получилось, по правде говоря, не очень-то изящно, ну да ладно.
Критерий Байеса
Иными словами, показателем неэффективности стратегии по критерию Байеса относительно рисков является среднее значение (математическое ожидание ожидание) рисков i-й строки матрицы
, вероятности которых, совпадают с вероятностями природы. Тогда оптимальной среди чистых стратегий по критерию Байеса относительно рисков является стратегия
, обладающая минимальной неэффективностью то есть минимальным средним риском. Критерий Байеса эквивалентен относительно выигрышей и относительно рисков, т.е. если стратегия
является оптимальной по критерию Байеса относительно выигрышей, то она является оптимальной и по критерию Байеса относительно рисков, и наоборот.
Перейдем к примеру и рассчитаем математические ожидания:
Максимальным математическим ожиданием является , следовательно, выигрышной стратегией является стратегия
.
Программная реализация критерия Байеса:
Критерий Лапласа
Критерий Лапласа представляет упрощенную максимизацию математического ожидания полезности, когда справедливо предположение о равной вероятности уровней спроса, что избавляет от необходимости сбора реальной статистики.
В общем случае при использовании критерия Лапласа матрица ожидаемых полезностей и оптимальный критерий определяются следующим образом:
Рассмотрим пример принятия решений по критерию Лапласа. Рассчитаем среднеарифметическое для каждой стратегии:
Таким образом, выигрышной стратегией является стратегия .
Программная реализация критерия Лапласа:
Смешанные стратегии. Аналитический метод
Аналитический метод позволяет решить игру в смешанных стратегиях. Для того, чтобы сформулировать алгоритм нахождения решения игры аналитическим методом, рассмотрим некоторые дополнительные понятия.
Стратегия доминирует стратегию
, если все
. Иными словами, если в некоторой строке платёжной матрицы все элементы больше или равны соответствующим элементам другой строки, то первая строка доминирует вторую и называется доминант-строкой. А также если в некотором столбце платёжной матрицы все элементы меньше или равны соответствующим элементам другого столбца, то первый столбец доминирует второй и называется доминант-столбцом.
Нижней ценой игры называется .
Верхней ценой игры называется .
Теперь можно сформулировать алгоритм решения игры аналитическим методом:
И класс, выполняющий решение симплекс-методом. Поскольку в математике я не разбираюсь, то воспользовался готовой реализацией из Apache Commons Math
В этой матрице есть доминирующее множество:
\begin
Решение игры при цене игры равной 3,33
Вместо заключения
Надеюсь, эта статья будет полезна тем, кому необходимо в первом приближении с решением игр с природой. Вместо выводов ссылка на GitHub.
Буду благодарен за конструктивную обратную связь!
Теория игр и статистических решений
5. ТЕОРИЯ ИГР И СТАТИСТИЧЕСКИХ РЕШЕНИЙ
5.1. Матричная игра с нулевой суммой
Экономико-математическое моделирование осуществляется в условиях:
Моделирование в условиях определенности предполагает наличие всех необходимых для этого исходных нормативных данных (матричное моделирование, сетевое планирование и управление).
Моделирование в условиях риска проводится при стохастической неопределенности, когда значения некоторых исходных данных случайны и известны законы распределения вероятностей этих случайных величин (регрессионный анализ, теория массового обслуживания).
Моделирование в условиях неопределенности соответствует полному отсутствию некоторых необходимых для этого данных (теория игр[1]).
Математические модели принятия оптимальных решений в конфликтных ситуациях строятся в условиях неопределенности.
В теории игр оперируют следующими основными понятиями:
Ходом будем называть выбор и осуществление игроком одного из предусмотренных правилами игры действий.
Функция выигрыша служит для определения величины платежа проигравшего игрока выигравшему.
В матричной игре функция выигрыша представляется в виде платежной матрицы:
,
где — величина платежа игроку I, выбравшему ход
, от игрока II, выбравшего ход
.
В такой парной игре значения функций выигрыша обоих игроков в каждой ситуации равны по величине и противоположны по знаку, т. е.
и такую игру называют с нулевой суммой.
Процесс «игры в матричную игру» представляется следующим образом:
— задается платежная матрица ;
— игрок I независимо от игрока II выбирает одну из строк этой матрицы, например,
-ую;
— игрок II независимо от игрока I выбирает один из столбцов этой матрицы, например,
— ый ;
— элемент матрицы
определяет, сколько получит игрок I от игрока II. Разумеется, если
, то речь идет о фактическом проигрыше игрока I.
Антагонистическую парную игру с платежной матрицей будем называть игрой
.
Рассмотрим игру .
Задана платежная матрица:
.
Пусть игрок I независимо от игрока II выбирает 3-ю строку этой матрицы, а игрок II независимо от игрока I выбирает 2-ой столбец этой матрицы:
Тогда игрок I получит 9 единиц от игрока II.
5.2. Оптимальная чистая стратегия в матричной игре
Оптимальной стратегией называется такая стратегия игрока I, при которой он не уменьшит своего выигрыша при любом выборе стратегии игроком II, и такая стратегия игрока II, при которой он не увеличит своего проигрыша при любом выборе стратегии игроком I.
Выбирая в качестве хода -ую строку платежной матрицы, игрок I обеспечивает себе выигрыш не менее величины
в наихудшем случае, когда игрок II будет стараться минимизировать эту величину. Поэтому игрок I выберет такую
-ую строку, которая обеспечит ему максимальный выигрыш:
.
Игрок II рассуждает аналогично и может наверняка обеспечить себе минимальный проигрыш:
.
Всегда справедливо неравенство:
.
Величину называют нижней ценой игры.
Величину называют верхней ценой игры.
Оптимальные стратегии и
называются чистыми, если для них выполняются равенства:
,
.
Величину называют чистой ценой игры, если
.
Оптимальные чистые стратегии и
образуют седловую точку
платежной матрицы
.
Для седловой точки выполняются условия:
для
;
для
,
т. е. элемент является наименьшим в строке и наибольшим в столбце.
Таким образом, если платежная матрица имеет седловую точку, то можно найти оптимальные чистые стратегии игроков.
Чистая стратегия игрока I может быть представлена упорядоченным набором
чисел (вектором), в котором все числа равны нулю, кроме числа, стоящего на
— ом месте, которое равно единице.
Чистая стратегия игрока II может быть представлена упорядоченным набором
чисел (вектором), в котором все числа равны нулю, кроме числа, стоящего на
— ом месте, которое равно единице.
Рассмотрим игру , заданную платежной матрицей:
.
Выбирая в качестве хода какую-нибудь строку платежной матрицы, игрок I обеспечивает себе выигрыш в наихудшем случае не менее величины в столбце, обозначенном :
Поэтому игрок I выберет 2-ую строку платежной матрицы, обеспечивающую ему максимальный выигрыш независимо от хода игрока II, который будет стараться минимизировать эту величину:
Игрок II рассуждает аналогично и выберет в качестве хода 1-ый столбец:
Таким образом, имеется седловая точка платежной матрицы:
,
соответствующая оптимальной чистой стратегии для игрока I и
для игрока II, при которой игрок I не уменьшит своего выигрыша при любом изменении стратегии игроком II и игрок II не увеличит своего проигрыша при любом изменении стратегии игроком I.
5.3. Оптимальная смешанная стратегия в матричной игре
Если платежная матрица не имеет седловой точки, то любому игроку нерационально использовать одну чистую стратегию. Выгоднее использовать «вероятностные смеси» чистых стратегий. Тогда в качестве оптимальных определяются уже смешанные стратегии.
Смешанная стратегия игрока характеризуется распределением вероятности случайного события, заключающегося в выборе этим игроком хода.
Смешанной стратегией игрока I называют такой упорядоченный набор чисел
(вектор), который удовлетворяет двум условиям:
1) для
, т. е. вероятность выбора каждой строки платежной матрицы неотрицательна;
2) , т. е. выбор каждой из
строк платежной матрицы в совокупности представляет полную группу событий.
Смешенной стратегией игрока II будет упорядоченный набор чисел
(вектор), удовлетворяющий условиям:
1) для
;
2) .
Величина платежа игроку I, выбравшему смешанную стратегию
,
от игрока II, выбравшему смешанную стратегию
,
.
Оптимальными называют смешанные стратегии
и
,
если для любых произвольных смешанных стратегий и
выполняется условие:
,
т. е. при оптимальной смешанной стратегии выигрыш игрока I наибольший, а проигрыш игрока II наименьший.
Если в платежной матрице нет седловой точки, то
,
т. е. существует положительная разность (нераспределенная разность)
—
³ 0,
и игрокам нужно искать дополнительные возможности для уверенного получения в свою пользу большей доли этой разности.
Рассмотрим игру , заданную платежной матрицей:
.
Определим, есть ли седловая точка:
,
.
Оказывается, что в платежной матрице нет седловой точки и нераспределенная разность равна :
.
5.4. Отыскание оптимальных смешанных стратегий
Определение оптимальных смешанных стратегий для платежной матрицы размерностью
осуществляется методом нахождения точек оптимума функции двух переменных.
Пусть вероятность выбора игроком I первой строки платежной матрицы
равна . Тогда вероятность выбора второй строки равна
.
Пусть вероятность выбора игроком II первого столбца равна . Тогда вероятность выбора второго столбца равно
.
Величина платежа игроку I игроком II равна:
.
Экстремальная величина выигрыша игрока I и проигрыша игрока II соответствует условиям:
,
;
,
.
Таким образом, оптимальные смешанные стратегии игроков I и II соответственно равны:
,
.
5.5. Геометрическое решение игр 2×n
При увеличении размерности платежной матрицы с до
уже нельзя определение оптимальных смешанных стратегий свести к нахождению оптимума функции двух переменных. Однако учитывая то, что один из игроков имеет только две стратегии, можно использовать геометрическое решение.
Основные этапы нахождения решения игры сводятся к следующему.
На плоскости введем систему координат. На оси
отложим отрезок
. Из левого и правого концов этого отрезка проведем перпендикуляры.
Левый и правый концы единичного отрезка соответствуют двум стратегиям и
, имеющимся у игрока I. На проведенных перпендикулярах будем откладывать выигрыши этого игрока. Например, для платежной матрицы
такими выигрышами игрока I при выборе стратегии будут
и
, а при выборе стратегии
будут
и
.
Соединим отрезками прямой точки выигрыша игрока I, соответствующие стратегиям игрока II. Тогда образованная ломанная линия, ограничивающая график снизу, определяет нижнюю границу выигрыша игрока I.
Находим оптимальную смешанную стратегию игрока I
,
которая соответствует точке на нижней границе выигрыша игрока I с максимальной ординатой.
Обратим внимание на то, что в рассматриваемом примере, пользуясь только двумя стратегиями и
, соответствующими прямым, пересекающимся в найденной точке на нижней границе выигрыша игрока I, игрок II может воспрепятствовать игроку I получить больший выигрыш.
Таким образом, игра сводится к игре
и оптимальной смешанной стратегией игрока II в рассматриваемом примере будет
,
где вероятность находится так же, как в игре
:
.
Если матричная игра не имеет решения в чистых стратегиях (т. е. нет седловой точки) и из-за большой размерности платежной матрицы не может быть решена графически, то для получения решения используют метод линейного программирования.
Пусть задана платежная матрица размерности :
.
Необходимо найти вероятности , с которыми игрок I должен выбирать свои ходы для того, чтобы данная смешанная стратегия гарантировала ему выигрыш не менее величины
независимо от выбора ходов игроком II.
Для каждого выбранного хода игроком II выигрыш игрока I определяется зависимостями:
Разделим обе части неравенств на и введем новые обозначения:
,
.
Равенство
примет вид:
.
Поскольку игрок I стремится максимизировать выигрыш , то обратную величину
нужно минимизировать. Тогда задача линейного программирования для игрока I примет вид:
Аналогично строится задача для игрока II как двойственная:
Решая задачи симплекс-методом, получаем:
,
при
;
при
.
5.7. Особенности решения матричных игр
Прежде, чем решать задачу по отысканию оптимальных стратегий, следует проверить два условия:
— можно ли упростить платежную матрицу;
— имеет ли платежная матрица седловую точку.
Рассмотрим возможность упрощения платежной матрицы:
.
В связи с тем, что игрок I стремится получить наибольший выигрыш, то из платежной матрицы можно вычеркнуть — ую строку, т. к. он никогда не воспользуется этим ходом, если выполняется следующее соотношение с любой другой
— ой строкой:
для
.
Аналогично, стремясь к наименьшему проигрышу, игрок II никогда не выберет в качестве хода — ый столбец в платежной матрице и этот столбец можно вычеркнуть, если выполняется следующее соотношение с любым другим
— ым столбцом:
для
.
Наиболее простым решением игры является наличие в упрощенной платежной матрице седловой точки, которая отвечает следующему условию (по определению):
.
Дана платежная матрица:
.
Упрощение платежной матрицы:
Наличие седловой точки:
5.8. Игра с природой
В отличие от задач теории игр в задачах теории статистических решений неопределенная ситуация не имеет антагонистической конфликтной окраски и зависит от объективной действительности, которую принято называть «природой».
В матричных играх с природой в качестве игрока II выступает совокупность неопределенных факторов, влияющих на эффективность принимаемых решений.
Матричные игры с природой отличаются от обычных матричных игр только тем, что при выборе оптимальной стратегии игроком I уже нельзя ориентироваться на то, что игрок II будет стремиться минимизировать свой проигрыш. Поэтому наряду с платежной матрицей вводится матрица рисков:
,
гдe — величина риска игрока I при использовании хода
в условиях
, равная разности
между выигрышем
, который игрок I получил бы, если бы знал, что установится условие
, т. е.
, и выигрышем
, который он получит, не зная при выборе хода
, что установится условие
.
Таким образом, платежная матрица однозначно преобразуется в матрицу рисков, а обратное преобразование неоднозначно.
.
.
Возможны две постановки задачи о выборе решения в матричной игре с природой:
Задача принятия решений может быть поставлена для одного из двух условий:
— в условиях риска, когда известна функция распределения вероятностей стратегий природы, например, случайной величины появления каждой из предполагаемых конкретных экономических ситуаций;
— в условиях неопределенности, когда такая функция распределения вероятностей неизвестна.
5.9. Решение задач теории статистических решений
При принятии решений в условиях риска игроку I известны вероятности наступления состояний природы.
Тогда игроку I целесообразно выбрать ту стратегию, для которой среднее значение выигрыша, взятое по строке, максимально:
.
При решении этой задачи с матрицей риска получаем такое же решение, соответствующее минимальному среднему риску:
.
5.10. Решение задач теории статистических решений
в условиях неопределенности
При принятии решений в условиях неопределенности можно воспользоваться следующими критериями:
— максиминным критерием Вальда;
— критерием минимального риска Севиджа;
— принципом недостаточного основания Лапласа.
Рассмотрим максиминный критерий Вальда.
Игра с природой ведется как с разумным агрессивным противником, т. е. осуществляется перестраховочный подход с позиции крайнего пессимизма для платежной матрицы:
.
Рассмотрим критерий минимального риска Севиджа.
Аналогичный предыдущему подход с позиции крайнего пессимизма для матрицы риска:
.
Предлагается возможность не руководствоваться ни крайним пессимизмом и ни крайним оптимизмом:
,
,
где степень пессимизма ;
при — крайний оптимизм,
при — крайний пессимизм.
Рассмотрим принцип недостаточного основания Лапласа.
Полагается, что все состояния природы равновероятны:
при
.
,
.
Выводы по пятому разделу
Если в платежной матрице имеется седловая точка, то игроки обладают оптимальными чистыми стратегиями, т. е. для выигрыша каждый из них должен повторять свой один оптимальный ход. Если же седловой точки нет, то для выигрыша каждый из них должен воспользоваться оптимальной смешанной стратегией, т. е. использовать смесь ходов, каждый из которых должен производиться с оптимальной вероятностью.
Отыскание оптимальных смешанных стратегий для игр 2×2 производится вычислением оптимальных вероятностей по известным формулам. С помощью геометрического решения игр 2×n определение оптимальных смешанных стратегий в них сводится к отысканию оптимальных смешанных стратегий для игр 2×2. Для решения игр m×n используют метод линейного программирования для нахождения оптимальных смешанных стратегий в них.
Некоторые платежные матрицы поддаются упрощению, в результате которого уменьшается их размерность за счет удаления строк и столбцов, соответствующих неперспективным ходам.
Если в качестве игрока II выступает совокупность неопределенных факторов, зависящих от объективной действительности и не имеющих антагонистической конфликтной окраски, то такую игру называют игрой с природой, а для ее решения используют задачи теории статистических решений. Тогда наряду с платежной матрицей вводится матрица рисков и возможны две постановки задачи о выборе решения в матричной игре с природой: максимизация выигрыша и минимизация риска.
Решение задач теории статистических решений в условиях риска показывает, что игроку I целесообразно выбрать ту стратегию, для которой среднее значение (математическое ожидание) выигрыша, взятое по строке платежной матрицы, максимально, или (что то же самое) среднее значение (математическое ожидание) риска, взятое по строке матрицы рисков, минимально. При принятии решений в условиях неопределенности используют следующие критерии: максиминный критерий Вальда, критерий минимального риска Севиджа, критерий пессимизма-оптимизма Гурвица, принцип недостаточного основания Лапласа.
Вопросы для самопроверки
— Как определяются основные понятия теории игр: ход, стратегия и функция выигрыша?
— В виде чего представляется в матричной игре функция выигрыша?
— Почему матричную игру называют с нулевой суммой?
— Как представляется процесс игры в матричную игру?
— Какая игра называется игрой m×n?
— Какая стратегия матричной игры называется оптимальной?
— Какая оптимальная стратегия матричной игры называется чистой?
— Что означает седловая точка платежной матрицы?
— Какая оптимальная стратегия матричной игры называется смешенной?
— Как представляется смешанная стратегия игрока?
— Что представляет собой величина платежа игроку I от игрока II, выбравшим смешанные стратегии?
— Какие смешанные стратегии называют оптимальными?
— Что означает нераспределенная разность?
— С помощью какого метода находятся оптимальные смешанные стратегии для игр 2×2?
— Каким образом находятся оптимальные смешанные стратегии для игр 2×n?
— С помощью какого метода находятся оптимальные смешанные стратегии для игр m×n?
— В чем заключаются особенности решения матричных игр?
— Что означает упрощение платежной матрицы и при каких условиях оно может быть осуществлено?
— Какую матричную игру легче решать, когда платежная матрица имеет или не имеет седловую точку?
— Какие задачи теории игр относятся к задачам теории статистических решений?
— Как платежная матрица преобразуется в матрицу рисков?
— Какие две постановки задачи о выборе решений возможны в матричной игре с природой?
— Для каких двух условий могут быть поставлены задачи принятия решений в матричной игре с природой?
— Какую стратегию целесообразно выбрать игроку I при решении задачи теории статистических решений в условиях риска?
— Какими критериями принятия решений можно воспользоваться при решении задач теории статистических решений в условиях неопределенности?
Примеры решения задач
1. В платежной матрице указаны величины прибыли предприятия при реализации им разных видов изделий (столбцы) в зависимости от установившегося спроса (строки). Необходимо определить оптимальную стратегию предприятия по выпуску изделий разных видов и соответствующий максимальный (в среднем) доход от их реализации.