Решение матричной игры. Платежная матрица игры

Подписаться
Вступай в сообщество «parkvak.ru»!
ВКонтакте:

Таблица, в которой показаны выплаты каждому участнику при двусторонней игре. Строки таблицы отражают результаты каждого выбора стратегии одним участником, а столбцы – результаты выбора другого. Может существовать одна матрица, показывающая выигрыш каждого игрока, а также альтернативный вариант, когда каждый квадрат в многомерной платежной матрице может содержать два числа, чтобы показать выплаты обоим игрокам. При игре с нулевой суммой выплаты второму игроку будут равны выплатам первому; таким образом, только один ряд необходимо записать подробно.


Конец работы -

Эта тема принадлежит разделу:

Ограничению риска в системе бизнеса носят название риск-менеджмент

Под риском понимают все внутренние и внешние предпосылки которые мо.. гут негативно повлиять на достижение стратегических целей в течение точно.. определенного отрезка времени наблюдения например периода оператив..

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ:

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

Виды рисков. Факторы, влияющие на возникновение рисков
Классификация: А) По характеру последствий: · Чистые (вызывают только убыток-риск пожара или наводнения); · Спекулятивные (могут приносить как убытки, та

Факторы, влияющие на возникновение рисков
Все рискообразующие факторы можно разделить на 2 группы: · внутренние факторы, возникающие в процессе деятельности предприятия; · внешние факторы, суще

Организация процесса управления рисками в организации
Первым этапом организации риск-менеджмента является определение цели риска и цели рисковых вложений капитала. Цель риска – это результат, который необходимо получить. Им может быть

Управление информационными рисками
Работа по минимизации информационных рисков заключается в предупреждении несанкционированного доступа к данным, а также аварий и сбоев оборудования. Для минимизации информационных рисков с

Карта рисков
Карта рисков – простой метод оценки рисков Представители разных отраслей экономики – зачастую задают, как консультантам по управлению рисками вопрос: есть ли простые и наг

Описание структуры карты рисков
На этой карте рисков вероятность или частота отображается по вертикальной оси, а сила воздействия или значимость - по горизонтальной оси. В этом случае вероятность появления риска увеличивае

Построение карты рисков
Производиться как в рамках внедрения системы управления рисками на уровне всей организации, что сложно, а зачастую и невозможно выполнить внутренними силами организации. Д

Основные шаги процесса самостоятельного картографирования рисков
1. первичное обучение 2. определение границ анализа 3. формирование состава команды 4. анализ сценариев и ранжирование 5. определение границы терпимости к риску

Методы управления рисками
Сами по себе методы риск-менеджмента достаточно разнообразны. Это связано с неоднозначностью понятия риска и наличием большого числа критериев их классификации. В следующем разделе

Параметрический метод
Он исходит из предположения о нормальном распределении вероятностей рассматриваемых факторов риска и требует в процессе построения модели расчёта VAR только оценки параметров этого

Моделирование по историческим данным
Метод исторического моделирования (historical simulation) основан на использовании исторических данных по изменениям факторов рыночного риска для получения распределения будущих колебаний стоимости

Метод Монте-Карло
из учебника: Метод Монте-Карло заключается в определении статистических моделей для активов портфеля и их моделировании посредством генерации случайных траекторий. З

Метод анализа сценариев
Метод анализа сценариев изучает эффект изменения капитала портфеля в зависимости от изменения величин рисковых факторов (напр., процентной ставки, волатильности) или параметров модели. Модел

Основные количественные характеристики рисков
Риск, которому подвергается предприятие, - это вероятная угроза разорения или несения таких финансовых потерь, которые могут остановить все дело. Поскольку вероятность неудачи присут

Выбор проектов на основе математического ожидания и среднего квадратического отклонения
Главной целью любого инвестора является получение ожидаемой прибыли от результатов инвестирования. Эта прибыль является ожидаемой в том смысле, что на этапе осуществления инвестирования ее величина

Закон нормального распределения (закон Гаусса)
Нормальное распределение (распределение Гаусса) используется при оценке надежности изделий, на которые воздействует ряд случайных факторов, каждый из которых незначительно влияет на результирующий

Типы математических игр
Кооперативные и некооперативные Игра называется кооперативной, или коалиционной, если игроки могут объединяться в группы, взяв на себя некоторые обязательства перед другими игроками и коор

Чистые стратегии в математической игре

Смешанные стратегии в математической игре
В теории игр страте́гия игрока в игре или деловой ситуации - это полный план действий при всевозможных ситуациях, способных возникнуть. Стратегия определяет действие игрока в любой момент игры

Вопрос №24
Основная теорема теории матричных игр, или теорема о минимаксе. Если – матрица

Вопрос №25
Графический метод применим к тем играм, в которых хотя бы один из игроков имеет две стратегии. Основные этапы нахождения решения игры 2×n или m×2: 1.Строят прямые, соо

Аналитическое решение смешанной игры
Чтобы найти оптимальную смешанную стратегию игрока А: и соответствующую цену игры ν, необходим

Методика мажорирования стратегий
Мажорирование представляет отношение между стратегиями, наличие которого во многих практических случаях дает возможность сократить размеры исходной платежной матрицы игры. Рассмотри

Использование дерева решений
На практике результат одного решения заставляет нас принимать следующее решение и т. д. Когда нужно принять несколько решений в условиях неопределенности, когда каждое решение зависит от исхода пре

Функция полезности Неймана-Моргенштерна
Основные определения и аксиомы.Методология рационального принятия решений в условиях неопределенности, основанная на функции полезности индивида, опирается на пять аксиом, которые отражают м

Концепция рисковой стоимости VAR
Одной из основных задач финансовых институтов является оценка рыночных рисков, которые возникают вследствие флуктуации (благоприятном событии) цен акций, сырьевых товаров, обменных курсов, процентн

Суть каждого принимаемого руководством решения - выбор наи­лучшей из нескольких альтернатив по конкретным, установленным заранее критериям. (Если вы захотите вспомнить рассмотрение ограничений и критериев для принятия решений, обратитесь к гл. 6). Платежная матрица - это один из методов статистической теории решений, метод, который может оказать помощь руководителю в выборе одного из нескольких вариантов. Он особенно полезен, когда руководитель должен установить, какая стратегия в наибольшей мере будет способствовать достижению целей.

Платежная матрица – один из методов статистической теории решений, помогающих в выборе одного из нескольких вариантов. Платежная матрица полезна, когда:

· имеется ограниченное количество альтернатив или стратегий для выбора;

· известна вероятность наступления событий

· результаты принятого решения зависят от того, какое решение принято и какие события имеют место.

Вероятность той или иной погоды Туман (0,1)Ясная погода (0,9)

Стратегия 1: Самолет+ $2000+ $4500

Стратегия 2: Поезд+ $3000+ $3000

Представим ситуацию торгового агента, который решает, лететь ему самолетом или ехать поездом за город, где находится потребитель. Если погода будет хорошей, он может лететь и потратить на всю дорогу от ворот до ворот 2 ч, а если придется ехать поездом - 7 ч. Если он поедет поездом, то потеряет день на месте его работы, который, по его оценке, мог бы увеличить сбыт на 1500 долл. По оценке иногородний потребитель должен вручить ему заказ на 3000 долл., если он лично посетит клиента. Если он запланирует лететь к клиенту, а потом самолет вынужден будет приземлиться из-за тумана, придется заменить личное посещение телефонным звонком. Это приведет к уменьшению заказа иногороднего клиента до 500 долл., зато агент сможет обеспечить заказы на 1500 долл. дома.

Приведенные выше данные платежной матрицы отражают оценку последствий разных вариантов действий. Дополнительно представлены некоторые предположения относительно вероятности тумана (который скажется на самолете, но не на поезде) и ясной погоды. Мы видим, что вероятность ясной погоды в 10 раз выше, чем тумана. Далее, матрица показывает, что, действуя по первому варианту стратегии (самолет), если погода будет хорошей (9 шансов из 10), торговый агент по оценке продаст товаров на 4500 долл. (это и есть результат или последствия). Три других варианта последствии можно объяснить таким же образом, мы опускаем эти рассуждения.

РИС. 8.4. Платежная матрица

Источник: Из работы МагВп К. StorrandIrvmgStein, ThtPraetiuofManiyfnuntScience (EnglewoodCliffs, N.Y.: Prentice-Hall, 1976),p 1 С разрешения.

По словам Н. Пола Лумбы: "Платеж представляет собой денежное вознаграж­дение или полезность, являющиеся следствием конкретной стратегии в сочетании с конкретными обстоятельствами. Если платежи представить в форме таблицы (или матрицы), мы получаем платежную матрицу"24, как показано на рис. 8.4. Слова "в сочетании с конкретными обстоятельствами" очень важны, чтобы понять, когда можно использовать платежную матрицу, и оценить, когда решение, принятое на ее основе, скорее всего, будет надежным. В самом общем виде матрица означает, что платеж зависит от определенных событий, которые фактически свершаются. Если такое событие или состояние природы не случается на деле, платеж неиз­бежно будет иным.

В целом платежная матрица полезна, когда:

1. Имеется разумно ограниченное число альтернатив, или вариантов, стратегии для выбора между ними.

2. То, что может случиться, с полной определенностью неизвестно.

3. Результаты принятого решения зависят от того, какая именно выбрана альтер­натива и какие события в действительности имеют место.

Кроме того, руководитель должен располагать возможностью объективной оценки вероятности релевантных событий и расчета ожидаемого значения такой вероятности. Руководитель редко имеет полную определенность. Но так же редко он действует в условиях полной неопределенности. Почти во всех случаях приня­тия решений руководителю приходится оценивать вероятность, или возможность, события. Из предшествующего рассмотрения напомним, что вероятность варьи­рует от 1, когда событие определенно произойдет, до 0, когда событие определен­но не произойдет. Вероятность можно определить объективно, как поступает игрок

в рулетку, ставя на нечетные номера. Выбор ее значения может опираться на прошлые тенденции или субъективную оценку руководителя, который исходит из собственного опыта действий в подобных ситуациях.

Если вероятность не была принята в расчет, решение всегда будет соскальзывать в направлении наиболее оптимистических последствий. Например, если исходить из того, что инвесторы на удачной кинокартине могут иметь 500% на инвестиро­ванный капитал, а при вложении в торговую сеть в самом благоприятном варианте всего 20%, то решение всегда должно быть в пользу кинопроизводства. Однако если взять в расчет, что вероятность большого успеха кинофильма весьма невы­сока, капиталовложения в магазины становятся более привлекательными, поскольку вероятность получения указанных 20% очень значительна. Если взять более простой пример, то выплаты при ставках в заезде на длинную дистанцию на скач­ках выше, поскольку выше вероятность, что не выиграешь вообще ничего

Вероятность прямо влияет на определение ожидаемого значения - централь­ной концепции платежной матрицы. Ожидаемое значение альтернативы, или вариан­та, стратегии - это сумма возможных значений, умноженных на соответствующие вероятности. К примеру, если вы считаете, что вложение средств (как стратегия действий) в киоск для торговли мороженым с вероятностью 0,5 обеспечит вам годовую прибыль 5000 долл., с вероятностью 0,2 - 10 000 долл. и с вероятностью 0,3 - 3000 долл., то ожидаемое значение составит:

5000 (0,5) + 10 000 (0,2) + 3000 (0,3) = 5400 долл.

Определив ожидаемое значение каждой альтернативы и расположив результаты в виде матрицы, руководитель без труда может установить, какой выбор наиболее привлекателен при заданных критериях. Он будет, конечно, соответствовать наивысшему ожидаемому значению. Исследования показывают - когда установ­лены точные значения вероятности, методы дерева решений и платежной мат­рицы обеспечивают принятие более качественных решений, чем традиционные подходы25.

Платежная матрица - это один из методов статистической теории решений, метод, который может оказать помощь руководителю в выборе одного из нескольких вариантов. Он особенно полезен, когда руководитель должен установить, какая стратегия в наибольшей мере будет способствовать достижению целей.

В целом платежная матрица полезна, когда :

1. Имеется разумно ограниченное число альтернатив или вариантов стратегии для выбора между ними.

2. То, что может случиться, с полной определенностью не известно.

3. Результаты принятого решения зависят от того, какая именно выбрана альтернатива и какие события в действительности имеют место.

Кроме того, руководитель должен располагать возможностью объективной оценки вероятности релевантных событий и расчета ожидаемого значения такой вероятности. Руководитель редко имеет полную определенность. Но также редко он действует в условиях полной неопределенности. Почти во всех случаях принятия решений руководителю приходится оценивать вероятность или возможность события.

Подходы:

а) без учета численных значений вероятностей исходов

б) с учетом численных значений вероятностей исходов

После построения матрицы выбирается вариант действий, обеспечивает оптимальное значение критерия.

а) – Правила при выборе вариантов действий:

1)максимальное решение – максимизация максимума критерия. В качестве критерия прибыль или доход

2)максимальное решение – максимизация минимума критерия (критерий – прибыль или доход)

3)минимаксное решение – минимизация максимума критерия.

Минимаксное решение– средний по степени риска подход.

б) – все решения будут оптимистическими, т.к ориентированы на более благоприятный исход событий.

Подходы:

1)максимизация критериев

2)минимизация критериев

Платежная матрица с учетом вероятности исходов событий:

– вероятность i – того варианта исхода событий

математическое ожидание критерия при выборе i – того варианта альтернатив действий

Алгоритм выбора решений:

1)Максимизация наиболее вероятных значений критерия

2)На основе правила максимальной вероятности минимизации наиболее вероятных значений критерия

3)На основе правила максимизации математического ожидания

4)На основе правила минимизации математического ожидания критерия.

35.Существование метода «Дерево решений».

Примеры подразумевают един.решение, однако на практике результат одного решения заставляет принимать следствие. Эту последовательность нельзя выразить платежной матрицей, поэтому, когда нужно принимать несколько решений, каждое из которых зависит от исходов предыдущего, используем схему «дерево решений».

Составляя «Дерево решений», можно нарисовать «ствол» и «ветви», отображающие структуру проблемы. Располагаются «деревья» слева направо. «Ветви» обозначают возможные альтернативные решения, которые могут быть приняты, и возможные исходы, возникающие в результате этих решений, ветви выходят из узлов, которые бывают двух типов:

1.Квадратный узел обозначает место, где принимаются решения

2.Квадратный узел обозначает место, где проявляются различные варианты исходов квадрата.

Два вида «ветвей»:

Пунктирные линии, выходящие из квадратов возможных решений, движение по ним зависит от принятия решений. На соответствующей пунктирной «ветви» проставляются все расходы, вызванные решением.

Сплошные линии, выходящие из кружков возможных исходов, движение по ним определяется исходом событий. На сплошной линии указывается вероятность данного исхода.

Квадрат – узел принятия решения.

Круг – узел ветвления вариантов исходов событий.

Пунктир – ветви, движение по которым зависит от принимаемого решения

Линия – ветви, движение по которым зависит от исхода событий.

3 этапа поиска решений:

1.Строится «дерево», когда все решения и их исходы указаны на «дереве», просчитывается каждый из вариантов, и в конце проставляется его денежный доход.

2.Вычисляется и проставляется на соответствующих «ветвях» вероятности каждого исхода.

3.Справа налево рассчитываются и проставляются денежные исходы каждого из узлов. Любые возникающие расходы вычитаются из ожидаемых доходов.

После того, как пройдены квадраты решений, выбирается «ветвь», ведущая к наибольшему из возможных при данном решении ожидаемому доходу. Другая «ветвь» зачеркивается, а ожидаемый доход проставляется над квадратом решения.

Так в конце третьего этапа оказывается сформированной последовательность решений, ведущая к максимальному доходу, в качестве критерия может выступать как максимизация математического ожидания, так и математическое ожидание потерь.

36.Особенности метода «Ранжирования решений» .

Данный метод предполагает 3 варианта стратегий: 1. осторожное (пессимистичное), 2. оптимистичное, 3.рациональное (рассчитано на среднее условие)

Известно, что метод платежной матрицы, без учета вероятности исхода, так же предполагает 3 варианта действий с точки зрения их рискованности.

Оптимистичной стратегией в методе платежной матрицы можно считать максимизационный подход, пессимистической - максимальный, а рациональный – минимаксный.

Суть пессимистической стратегии состоит в том, что ЛПР должно рассчитывать при выборе решения на худшее(решение не требует знания вероятности решения)

Оптимальное по критерию пессимизма решения определяется путем нахождения для каждого решения наихудшей оценки по всем ситуациям и последующ.выбором наилучшей из них (наилучшего из наихудшего решения).

Пример алгоритма выбора решения по критерию пессимизма .

Мы имеем n-вариантов действий, Aj и m – вариантов, Si – (события?).

Определен.ранги bij, для каждого из решения Aj (j=1+n).

В случае, если события будут развиваться по варианту Si в этом же этапе ранги могут быть выставлены либо индивидуально ЛПР, либо методом коллективной экспертной оценки. Результат ранжирования сводится в таблицу.

Варианты

Коэф-ты важности Kj

Aj (j=1 ÷n), по всем ситуациям Si (i=1÷m)

Коэф.важности Kj соответствует максимальному АО абсолютной величине значению ранга решения по всем ситуациям (наихудшая оценка). Kj=max bij по i.

Выбирается оптимальное решение, которое соответствует минимальному, по абсолютной величине, значению Kj всех решений (наилучшая оценка). А пессим.=min Kj по j.

Оптимистичной стратегии соответствует критерий оптимизма. В этом случае ЛПР должно рассчитывать на лучшее.

Оптимальное, по критерию оптимизма, решение определяется путем нахождения для каждого решения наилучшей оценки по всем ситуациям и последующим выборам наилучших из них (наилучшее решение). Правило выбора оптимального решения в дан.случае имеет вид: Kj=min bij по i, A =min Kj по j.

Оптимал.решение min A1 и A2. A оптим. – A1 и A2.

Рациональная стратегия реализации по критерию максимума среднего выигрыша.

ЛПР должно рассчитывать решение на наибольшую вероятность условия. Для реализации рациональной стратегии требуется знание вероятностей Pi исходов, событий Si.

Коэффициент важности в дан.случае представляет собой средний выигрыш, который получается при каждом решении по всем ситуациям.

Вар-т исход

Вар.действий

Вар-т исход. Р

Коэф. важн.Kj

Mj=∑i aij*Pi. Оптимальное решение соответствует максимальному значению коэф.важности. Aрац.=max Kj по j. Оптимальным решением в дан.случае будет А3, т.к.ему соответствует max значение важности (К3=2,8)

Платежная матрица - один из методов статистической теории решений, оказывающий помощь руководителю в выборе одного из нескольких вариантов. Особенно полезен в ситуации, когда руководитель должен установить, какая стратегий в наибольшей мере будет способствовать достижению целей. В самом общем виде матрица означает, что платеж зависит от определенных событий, которые фактически совершаются. Если событие или состояние природы не случается на деле, платеж неизменно будет другим.

В целом платежная матрица полезна, когда:

  • · имеется разумно ограниченное число альтернатив или вариантов стратегии для выбора между ними.
  • · то, что может случиться, с полной определенностью не известно.

Результаты принятого решения зависят от того, какая именно выбрана альтернатива, и какие события в действительности имеют место.

Кроме того, руководитель должен иметь возможность объективно оценить вероятность релевантных событий и рассчитать ожидаемое значение такой вероятности.

Вероятность прямо влияет на определение ожидаемого значения - основного понятия платежной матрицы. Ожидаемое значение альтернативы или варианта - это сумма возможных значений, умноженных на соответствующие вероятности.

Определив ожидаемое значение каждой альтернативы и расположив результаты в виде матрицы, руководитель без труда может выбрать наиболее оптимальный вариант. платежный матрица релевантный

По словам Н. Пола Лумбы: "Платеж представляет собой денежное вознаграждение или полезность, являющиеся следствием конкретной стратегии в сочетании с конкретными обстоятельствами. Если платежи представить в форме таблицы (или матрицы), мы получаем платежную матрицу", Слова "в сочетании с конкретными обстоятельствами" очень важны, чтобы понять, когда можно использовать платежную матрицу и оценить, когда решение, принятое на ее основе, скорее всего будет надежным. В самом общем виде матрица означает, что платеж зависит от определенных событий, которые фактически свершаются. Если такое событие или состояние природы не случается на деле, платеж неизбежно будет иным.

Руководитель редко имеет полную определенность. Но также редко он действует в условиях полной неопределенности. Почти во всех случаях принятия решений руководителю приходится оценивать вероятность или возможность события.

В платежной матрице представляются платежи в сочетании с конкретными обстоятельствами в форме таблицы или матрицы.

Для применения данного метода руководителю необходимо определить вероятность события, которая варьируется от 1 до 0. Выбор ее значения может опираться на прошлые тенденции или субъективную оценку руководителя, который исходит из собственного опыта действий в подобных ситуациях.

Вероятность прямо влияет на определение ожидаемого значения - центральной концепции платежной матрицы. Ожидаемое значение альтернативы или варианта стратегии - это сумма возможных значений умноженных на соответствующие вероятности.

Определив ожидаемое значение каждой альтернативы и расположив результаты в виде матрицы, руководитель без труда может установить, какой выбор наиболее предпочтителен при заданных критериях. Он будет, конечно, соответствовать наивысшему ожидаемому значению.

Вероятность можно определить объективно, как поступает игрок в рулетку, ставя на нечетные номера. Выбор ее значения может опираться на прошлые тенденции или субъективную оценку руководителя, который исходит из собственного опыта действий в подобных ситуациях.

Если вероятность не была принята в расчет, решение всегда будет соскальзывать в направлении наиболее оптимистических последствий.

Лекция 9. Понятие об игровых моделях. Платежная матрица.

§ 6 ЭЛЕМЕНТЫ ТЕОРИИ ИГР

6.1 Понятие об игровых моделях.

Математи­ческая модель конфликтной ситуации называется игрой , стороны, участвующие в конфликте, – игроками, а исход конфликта – выигрышем .

Для каждой формализованной игры вводятся правила , т.е. система условий, определяющая: 1) варианты действий игро­ков; 2) объем информации каждого игрока о поведении партне­ров; 3) выигрыш, к которому приводит каждая совокупность дей­ствий. Как правило, выигрыш (или проигрыш) может быть задан количественно; например, можно оценить проигрыш нулем, выигрыш – единицей, а ничью – 1/2. Количественная оценка результатов игры называется платежом .

Игра называется парной , если в ней участвуют два игрока, и множественной , если число игроков больше двух. Мы будем рас­сматривать только парные игры. В них участвуют два игрока А и В, интересы которых противоположны, а под игрой будем пони­мать ряд действий со стороны А и В.

Игра называется игрой с нулевой суммой, или антагонистиче­ ской , если выигрыш одного из игроков равен проигрышу другого, т.е. сумма выигрышей обеих сторон равна нулю. Для полного задания игры достаточно указать величину одно­го изних. Если обозначить а – выигрыш одного из игроков, b выигрыш другого, то для игры с нулевой суммой b = а , поэтому достаточно рассматривать, например а.

Выбор и осуществление одного из предусмотренных правила­ми действий называется ходом игрока. Ходы могут быть личными и случайными . Личный ход это сознательный выбор игроком одного из возможных действий (например, ход в шахматной игре). Набор возможных вариантов при каждом личном ходе регламентирован правилами игры и зависит от всей совокупности предшествующих ходов с обеих сторон.

Случайный ход это случайно выбранное действие (напри­мер, выбор карты из перетасованной колоды). Чтобы игра была математически определенной, правила игры должны для каждого случайного хода указывать рас­пределение вероятностей возможных исходов.

Некоторые игры могут состоять только из случайных ходов (так называемые чисто азартные игры) или только из личных ходов (шахматы, шашки). Большинство карточных игр принадлежит к играм смешанного типа, т. е. содержит как случайные, так и личные ходы. В дальнейшем мы будем рассматривать только личные ходы игроков.

Игры классифицируются не только по характеру ходов (личные, случайные), но и по характеру и по объему инфор­мации, доступной каждому игроку относительно действий другого. Особый класс игр составляют так называемые «игры с полной информацией». Игрой с полной информацией назы­вается игра, в которой каждый игрок при каждом личном ходе знает результаты всех предыдущих ходов,как личных, так и случайных. Примерами игр с полной информацией могут служить шахматы, шашки, а также известная игра «крестики и нолики». Большинство игр, имеющих практическое значение, не при­надлежит к классу игр с полной информацией, таккак неиз­вестность по поводу действий противника обычно является существенным элементом конфликтных ситуаций.

Одним из основных понятий теории игр является понятие стратегии .

Стратегией игрока называется совокупность правил, опреде­ляющих выбор его действия при каждом личном ходе в зависимо­сти от сложившейся ситуации. Обычно в процессе игры при каж­дом личном ходе игрок делает выбор в зависимости от конкрет­ной ситуации. Однако в принципе возможно, что все решения приняты игроком заранее (в ответ на любую сложившуюся ситуа­цию). Это означает, что игрок выбрал определенную стратегию, которая может быть задана в виде списка правил или программы. (Так можно осуществить игру с помощью ЭВМ). Игра называется конечной , если у каждого игрока имеется конечное число страте­гий, и бесконечной .– в противном случае.

Для того чтобы решить игру, или найти решение игры , следует для каждого игрока выбрать стратегию, которая удовле­творяет условию оптимальности , т.е. один из игроков должен по­лучать максимальный выигрыш, когда второй придерживается своей стратегии, В то же время второй игрок должен иметь минимальный проигрыш , если первый придерживается своей стратегии. Такие стратегии называются оптимальными . Оптимальные стратегии должны также удовлетворять условию устойчивости , т.е. любому из игроков должно быть невыгодно отказаться от своей стратегии в этой игре.

Если игра повторяется достаточно много раз, то игроков может интересовать не выигрыш и проигрыш в каждой конкретной пар­тии, а средний выигрыш (проигрыш) во всех партиях.

Целью теории игр является определение оптимальной стратегии для каждого игрока.

6.2. Платежная матрица. Нижняя и верхняя цена игры

Конечная игра, в которой игрок А имеет т стратегий, а игрок В – п стратегий, называется игрой .

Рассмотрим игру
двух игроковА и В («мы» и «противник»).

Пусть игрок А располагает т личными стратегиями, которые обозначим
. Пусть у игрокаВ имеется n личных стратегий, обозначим их
.

Пусть каждая сторона выбрала определенную стратегию; для нас это будет , для противника. В результате выбора игроками любой пары стратегийи(
) однозначно определяется исход игры, т.е. выигрышигрокаА (положительный или отрицательный) и проигрыш
игрокаВ.

Предположим, что значения известны для любой пары страте­гий (,). Матрица
,
, элементами которой являются выигрыши, соответствующие страте­гиям и , называется платежной матрицей или матрицей игры. Строки этой матрицы соот­ветствуют стратегиям игрока А, а столбцы – стратегиям игрока B . Эти стратегии называются чистыми.

Матрица игры
имеет вид:

Рассмотрим игру
с матрицей

и определим наилучшую среди стратегий
. Выбирая стратегию , игрок А должен рассчитывать, что игрок В ответит на нее той из стратегий , для которой выигрыш для иг­рока А минимален (игрок В стремится "навредить" игроку A ).

Обозначим через наименьший выигрыш игрокаА при вы­боре им стратегии для всех возможных стратегий игрокаВ (наименьшее число в i -й строке платежной матрицы), т.е.

(1)

Среди всех чисел (
) выберем наибольшее:
.

Назовем
нижней ценой нгры, или максимальным выигрышем (максмином). Это гарантированный выигрыш игрока А при любой стратегии игрока В. Следовательно,

. (2)

Стратегия, соответствующая максимину, называется максиминной стратегией . Игрок В заинтересован в том, чтобы уменьшить выигрыш игрока А, выбирая стратегию , он учитывает макси­мально возможный при этом выигрыш для А. Обозначим

. (3)

Среди всех чисел выберем наименьшее

и назо­вем верхней ценой игры илиминимаксным выигрышем (минимаксом). Эго гарантированный проигрыш игрока В . Следова­тельно,

. (4)

Стратегия, соответствующая минимаксу, называется минимаксной стратегией.

Принцип, диктующий игрокам выбор наиболее "осторожных" минимаксной и максиминной стратегий, называется принципом минимакса . Этот принцип следует из разумного предположения, что каждый игрок стремится достичь цели, противоположной цели противника.

Теорема. Нижняя цена игры всегда не превосходит верхней цены игры
.

Если верхняя и нижняя цены игры совпадают, то общее значе­ние верхней и нижней цены игры
называется чистой ценой игры, или ценой игры. Минимакс­ные стратегии, соответствующие цене игры, являются оптимальными стратегиями , а их совокупность – оптимальным решением или решением игры. В этом случае игрок А получает максимальный га­рантированный (не зависящий от поведения игрока В) выигрыш v , а игрок В добивается минимального гарантированного (вне зависи­мости от поведения игрока А) проигрыша v . Говорят, что решение игры обладает устойчивостью , т.е. если один из игроков придержи­вается своей оптимальной стратегии, то для другого не может быть выгодным отклоняться от своей оптимальной стратегии.

Если один из игроков (например А) придерживается своей оптимальной стратегии, а другой игрок (В) будет любым способом отклоняться от своей оптимальной стра­тегии, то для игрока, допустившего отклонение, это никогда не может оказаться выгодным; такое отклонение игрока В может в лучшем случае оставить выигрыш неизменным. а в худшем случае – увеличить его.

Наоборот, если В придерживается своей оптимальной стратегии, а А отклоняется от своей, то это ни в коем случае не может быть выгодным для А.

Пара чистых стратегий и дает оптимальное решение игры тогда и только тогда, когда соответствующий ей элемент явля­ется одновременно наибольшим в своем столбце и наименьшим в своей строке. Такая ситуация, если она существует, называется седловой точкой. В геометрии точку на поверхности, обладающую свойством: одновременный минимум по одной координате и максимум по другой, называют седловой точкой, по аналогии этот термин применяют в теории игр.

Игра, для которой
,
называется игрой с седловой точкой. Элемент , обладающий этим свойством, седловой точкой матрицы.

Итак, для каждой игры с седловой точкой существует решение, определяющее пару оптимальных стратегий обеих сторон, отличающуюся следующими свойствами.

1) Если обе стороны придерживаются своих оптимальных стратегий, то средний выигрыш равен чистой цене игры v , одновременно являющейся ее нижней и верхней ценой.

2) Если одна из сторон придерживается своей оптимальной стратегии, а другая отклоняется от своей, то от этого отклоняющаяся сторона может только потерять и ни в коем случае не может увеличить свой выигрыш.

Класс игр, имеющих седловую точку, представляет боль­шой интерес как с теоретической, так и с практической точки зрения.

В теории игр доказывается, что, в частности, каждая игра с полной информацией имеет седловую точку, и, сле­довательно, каждая такая игра имеет решение, т. е. суще­ствует пара оптимальных стратегий той и другой стороны, дающая средний выигрыш, равный цене игры. Если игра с полной информацией состоит только из личных ходов, то при применении каждой стороной своей оптимальной стратегии она должна всегда кончаться вполне определенным исходом, а именно, выигрышем, в точности равным цене игры.

← Вернуться

×
Вступай в сообщество «parkvak.ru»!
ВКонтакте:
Я уже подписан на сообщество «parkvak.ru»