Рассмотрим классическую схему принятия решений в условиях неопределённости.
Напомним, что финансовой называется операция, начальное и конечное состояния которой имеют денежную оценку, и цель проведения которой заключается в максимизации дохода – разности между конечной и начальной оценками. Почти всегда финансовые операции проводятся в условиях неопределённости и поэтому их результат невозможно предсказать заранее. Проводящий операцию называется ЛПР – Лицо, Принимающее Решение (во многих случаях ЛПР – это инвестор). Операция называется рискованной , если она может иметь несколько исходов, не равноценных для ЛПР.
Задача. Рассмотрим 3 операции с одним и тем же множеством двух исходов – альтернатив А и В, которые характеризуют доходы, получаемые ЛПР.
Все 3 операции рискованные. Для 1-ой и 2-ой это очевидно, но почему считается рискованной 3-я операция? Ведь она сулит только положительные доходы ЛПР? Рассматривая возможные исходы 3-ей операции, видим, что можем получить доход в размере 20 ед., поэтому возможность получения дохода в 15 ед. рассматривается как неудача, как риск недополучить 5 ед. дохода.
Как оценить финансовую операцию с точки зрения её доходности и риска? На этот вопрос не так просто ответить, главным образом из-за многогранности понятия риска. Существует несколько разных способов такой оценки. Рассмотрим один из таких подходов.
Матрицы последствий и рисков. Пусть рассматривается вопрос о проведении финансовой операции, имеющей несколько возможных исходов. В связи с этим проводится анализ возможных решений и их последствий. Предположим, что ЛПР рассматривает m возможных решений: i = 1,…, m . Ситуация неопределённа, известно лишь, что имеет место один из n вариантов: j = 1,…, n . Если будет принято i -тое решение, а ситуация сложится j -тая, то доход, полученный ЛПР будет равен q ij . Матрица Q = (q ij ) называется матрицей последствий (возможных решений ). Какое же решение нужно принять ЛПР? В этой неопределённой ситуации могут быть высказаны лишь некоторые рекомендации. Они не обязательно будут приняты ЛПР. Многое будет зависеть, например, от его склонности к риску. Но как оценить риск в данной схеме? Допустим, мы хотим оценить риск, который несёт i -тое решение. Нам неизвестна реальная ситуация, но если бы мы её знали, то выбрали бы наилучшее решение, т.е. приносящее наибольший доход. Если ситуация j -тая, то принимается решение, дающее доход . Значит, принимаяi -тое решение, мы рискуем получить не , а толькоq ij , т.е. принятие i -того решения несёт риск недобрать . МатрицуR = () называютматрицей рисков .
Задача. Пусть есть матрица последствий:.
Составим матрицу рисков:.
Ситуация полной неопределённости характеризуется отсутствием какой бы то ни было дополнительной информации (например, о вероятностях тех или иных вариантов реальной ситуации). Какие же существуют правила-рекомендации по принятию решений в этой ситуации?
Правило
Вальда
(правило
крайнего пессимизма
).
Если руководствоваться этим критерием,
надо всегда ориентироваться на худшие
условия, зная наверняка, что «хуже этого
не будет». Рассматривая i
-тое
решение, будем полагать, что на самом
деле ситуация складывается самая плохая,
т.е. приносящая самый малый доход:
.
Теперь выберем решениеi
0
с наибольшим
:.
В задаче имеемИз
этих чисел находим максимальное – 3.
Правило Вальда рекомендует принять 3-е
решение. Очевидно, такой подход –
«перестраховочный», естественный для
того, кто очень боится проиграть.
Правило
Сэвиджа
(правило
минимального риска
).
Этот критерий тоже крайне пессимистический,
но при выборе оптимальной стратегии
советует ориентироваться не на величину
дохода, а на риск. При применении этого
правила анализируется матрица рисков
R
= ().Рассматриваяi
-тое
решение, будем полагать, что на самом
деле складывается ситуация максимального
риска
.
Теперь выберем решениеi
0
с наименьшим
:.
В задаче имеемВ задаче имеемИз этих чисел находим минимальное – 5.
Правило Сэвиджа рекомендует принять
3-е решение. Сущность такого подхода в
том, чтобы всячески избегать большого
риска при принятии решения.
Правило Гурвица (пессимизма-оптимизма ). Этот критерий рекомендует при выборе решения не руководствоваться ни крайним пессимизмом, ни крайним оптимизмом. Принимается решение, при котором достигается максимум , где- «коэффициент пессимимзма». Значениевыбирается из субъективных соображений. Еслиприближается к 1, правило Гурвица приближается к правилу Вальда, при приближениик 0 правило Гурвица приближается к правилу «крайнего оптимизма», рекомендующему выбирать ту стратегию, при которой выигрыш в строке максимален. В задаче прикритерий Гурвица рекомендует 2-ое решение.
Предположим, что в рассматриваемой схеме известны вероятности того, что реальная ситуация развивается по вариантуj . Такое положение называется частичной неопределённостью . Какие рекомендации по принятию решения в этом случае? Можно руководствоваться одним из следующих правил.
Правило максимизации среднего ожидаемого дохода. Доход, получаемый компанией при реализации i -ого решения, является случайной величиной с законом распределения
q i1 |
q i2 |
q in |
||
Математическое ожидание этой случайной величины и есть средний ожидаемый доход. Критерий рекомендует принять решение, максимизирующее средний ожидаемый доход.
Задача. Пусть в предыдущей задаче ТогдаМаксимальный средний ожидаемый доход равен 7, что соответствует 3-ему решению.
Правило минимизации среднего ожидаемого риска. Риск компании при реализации i -ого решения является случайной величиной с законом распределения
r i1 |
r i2 |
r in |
||
Математическое ожидание этой случайной величины и есть средний ожидаемый риск. Критерий рекомендует принять решение, минимизирующее средний ожидаемый риск.
ТЕХНИЧЕСКАЯ ДИАГНОСТИКА ЭЛЕКТРОННЫХ СРЕДСТВ
УДК 678.029.983
Составитель: В.А. Пиккиев.
Рецензент
Кандидат технических наук, доцент О.Г. Бондарь
Техническая диагностика электронных средств : методические рекомендации для проведения практических занятий по дисциплине «Техническая диагностика электронных средств»/ Юго-Зап. гос. ун-т.; сост.: В.А. Пиккиев, Курск, 2016. 8с.: ил.4, табл.2, прилож.1. Библиогр.:с. 9 .
Методические указания для проведения практических занятий предназначены для студентов направления подготовки 11.03.03 «Конструирование и технология электронных средств».
Подписано в печать. Формат 60х84 1\16 .
Усл. печ. л. Уч.-изд.л. Тираж 30 экз. Заказ. Бесплатно
Юго-Западный государственный университет.
ВВЕДЕНИЕ. ЦЕЛЬ И ЗАДАЧИ ИЗУЧЕНИЯ ДИСЦИПЛИНЫ. | |
1. Практическое занятие № 1. Метод минимального числа ошибочных решений | |
2. Практическое занятие № 2. Метод минимального риска | |
3. Практическое занятие № 3. Метод Байеса | |
4. Практическое занятие № 4. Метод наибольшего правдоподобия | |
5. Практическое занятие № 5. Метод минимакса | |
6. Практическое занятие № 6. Метод Неймана–Пирсона | |
7. Практическое занятие № 7. Линейные разделяющие функции | |
8. Практическое занятие № 8. Обобщенный алгоритм нахождения разделяющей гиперплоскости | |
ВВЕДЕНИЕ. ЦЕЛЬ И ЗАДАЧИ ИЗУЧЕНИЯ ДИСЦИПЛИНЫ .
Техническая диагностика рассматривает задачи диагностирования, принципы организации систем тестового и функционального диагноза, методы и процедуры алгоритмов диагноза для проверки неисправности, работоспособности и правильности функционирования, а также для поиска неисправностей различных технических объектов. Основное внимание уделяется логическим аспектам технической диагностики при детерминированных математических моделях диагноза.
Цель дисциплины состоит в освоении методов и алгоритмов технической диагностики.
Задачей курса является подготовка технических специалистов освоивших:
Современные методы и алгоритмы технической диагностики;
Модели объектов диагностирования и неисправностей;
Алгоритмы диагностирования и тесты;
Моделирование объектов;
Аппаратуру систем поэлементного диагностирования;
Сигнатурный анализ;
Системы автоматизации диагностирования РЭА и ЭВС;
Навыки разработки и построения моделей элементов.
Предусмотреные в учебном плане практические занятия, позволяют формировать у студентов профессиональные компетенции аналитического и творческого мышления путем приобретения практических навыков диагностики электронных средств.
Практические занятия предусматривают работу с прикладными задачами разработки алгоритмов поиска неисправностей электронных устройств и построению контролирующих тестов с целью их дальнейшего использования при моделировании функционирования этих устройств.
ПРАКТИЧЕСКОЕ ЗАНЯТИЕ № 1
МЕТОД МИНИМАЛЬНОГО ЧИСЛА ОШИБОЧНЫХ РЕШЕНИЙ.
В задачах надежности рассматриваемый метод часто дает «неосторожные решения», так как последствия ошибочных решений существенно различаются между собой. Обычно цена пропуска дефекта существенно выше цены ложной тревоги. Если указанные стоимости приблизительно одинаковы (для дефектов с ограниченными последствиями, для некоторых задач контроля и др.), то применение метода вполне оправдано.
Вероятность ошибочного решения определяется так
D 1 - диагноз исправного состояния;
D 2 - диагноз дефектного состояния;
P 1 -вероятность 1 диагноза;
P 2 - вероятность 2-го диагноза;
x 0 - граничное значение диагностического параметра.
Из условия экстремума этой вероятности получаем
Условие минимума дает
Для одномодальных (т. е. содержат не более одной точки максимума) распределений неравенство (4) выполняется, и минимум вероятности ошибочного решения получается из соотношения (2)
Условие выбора граничного значения (5) называется условием Зигерта–Котельникова (условием идеального наблюдателя). К этому условию приводит также метод Байеса.
Решение x ∈ D1 принимается при
что совпадает с равенством (6).
Рассеяние параметра (величина среднеквадратичного отклонения) принимается одинаковым.
В рассматриваемом случае плотности распределений будут равны:
Таким образом, полученные математические модели(8-9) могут быть использованы для диагностики ЭС.
Пример
Диагностика работоспособности жестких дисков осуществляется по количеству битых секторов (Reallocated sectors). Фирма Western Digital при производстве ЖД модели “My Passport” использует следующие допуски: Исправными считаются диски у которых среднее значение составляет х 1 = 5 на единицу объема и среднеквадратичное отклонение σ 1 = 2 . При наличии дефекта магнитного напыления (неисправное состояние) эти значения равны х 2 = 12, σ 2 = 3 . Распределения предполагаются нормальными.
Требуется определить предельное количество неисправных секторов, выше которого жесткий диск подлежит снятию с эксплуатации и разборке (во избежание опасных последствий). По статистическим данным, неисправное состояние магнитного напыления наблюдается у 10% ЖД.
Плотности распределения:
1. Плотность распределения для исправного состояния:
2. Плотность распределения для дефектного состояния:
3. Разделим плотности состояния и приравняем к вероятностям состояний:
4. Прологарифмируем данное равенство и найдем предельное количество неисправных секторов:
Это уравнение имеет положительный корень x 0 =9,79
Критическое количество битых секторов равно 9 на единицу объема.
Варианты задания
№ п/п | х 1 | σ 1 | х 2 | σ 2 |
Вывод : Использование данного метода позволяет принимать решение без оценки последствий ошибок, из условий задачи.
Недостатком является то, что указанные стоимости приблизительно одинаковы.
Применение данного метода, распространено в приборостроение и машиностроении.
Практическое занятие № 2
МЕТОД МИНИМАЛЬНОГО РИСКА
Цель работы: изучение метода минимального риска для диагностики технического состояния ЭС.
Задачи работы :
Изучить теоретические основы метода минимального риска;
Провести практические расчеты;
Сделать выводы по использованию метода минимального риска ЭС.
Теоретические пояснения .
Вероятность принятия ошибочного решения слагается из вероятностей ложной тревоги и пропуска дефекта. Если приписать «цены» этим ошибкам, то получим выражение для среднего риск.
Где D1- диагноз исправного состояния; D2- диагноз дефектного состояния; P1-вероятность 1 диагноза; P2- вероятность 2-го диагноза; x0- граничное значение диагностического параметра; С12- стоимость ложной тревоги.
Разумеется, цена ошибки имеет условное значение, но она должна учесть предполагаемые последствия ложной тревоги и пропуска дефекта. В задачах надежности стоимость пропуска дефекта обычно существенно больше стоимости ложной тревоги (C12 >> C21). Иногда вводится цена правильных решений С11 и С22, которая для сравнения со стоимостью потерь (ошибок) принимается отрицательной. В общем случае средний риск (ожидаемая величина потери) выражается равенством
Где С11, С22 - цена правильных решений.
Величина x, предъявляемая для распознавания, является случайной и потому равенства (1) и (2) представляют собой среднее значение (математическое ожидание) риска.
Найдем граничное значение x0 из условия минимума среднего риска. Дифференцируя (2) по x0 и приравнивая производную нулю, получим сначала условие экстремума
Это условие часто определяет два значения x0, из которых одно соответствует минимуму, второе – максимуму риска (рис. 1). Соотношение (4) является необходимым, но недостаточным условием минимума. Для существования минимума R в точке x = x0 вторая производная должна быть положительной (4.1.), что приводит к следующему условию
|
|
относительно производных плотностей распределений:
Если распределения f (x, D1) и f(x, D2) являются, как обычно, одномодальными (т. е. содержат не более одной точки максимума), то при
Условие (5) выполняется. Действительно, в правой части равенства стоит положительная величина, а при x>x1 производная f "(x/D1), тогда как при x В дальнейшем под x0 будем понимать граничное значение диагностического параметра, обеспечивающее по правилу (5) минимум среднего риска. Будем также считать распределения f (x / D1) и f (x / D2) одномодальными («одногорбыми»). Из условия (4) следует, что решение об отнесении объекта x к состоянию D1 или D2 можно связать с величиной отношения правдоподобия. Напомним, что отношение плотностей вероятностей распределения x при двух состояниях называется отношением правдоподобия. По методу минимального риска принимается следующее решение о состоянии объекта, имеющего данное значение параметра x: Эти условия вытекают из соотношений (5) и (4). Условие (7) соответствует x< x0, условие (8) x > x0. Величина (8.1.) представляет собой пороговое значение для отношения правдоподобия. Напомним, что диагноз D1 соответствует исправному состоянию, D2 – дефектному состоянию объекта; C21 – цена ложной тревоги; C12 – цена пропуска цели (первый индекс – принятое состояние, второй – действительное); C11 < 0, C22 – цены правильных решений (условные выигрыши). В большинстве практических задач условные выигрыши (поощрения) для правильных решений не вводятся и тогда Часто оказывается удобным рассматривать не отношение правдоподобия, а логарифм этого отношения. Это не изменяет результата, таккак логарифмическая функция возрастает монотонно вместе со своимаргументом. Расчет для нормального и некоторых других распределений при использовании логарифма отношения правдоподобия оказывается несколько проще. Рассмотрим случай, когда параметр x имеет нормальное распределение при исправном D1 и неисправном D2 состояниях. Рассеяние параметра (величина среднеквадратичного отклонения) принимается одинаковым. В рассматриваемом случае плотности распределений Внося эти соотношения в равенство (4), получаем после логарифмирования Диагностика работоспособности флэш накопителей осуществляется по количеству битых секторов (Reallocated sectors). Фирма Toshiba TransMemory при производстве модели “UD-01G-T-03” использует следующие допуски: Исправными считаются накопители у которых среднее значение составляет х1 = 5 на единицу объема. Среднеквадратичное отклонение примем равным ϭ1 = 2. При наличии дефекта NAND памяти эти значения равны х2 = 12, ϭ2 = 3 . Распределения предполагаются нормальными. Требуется определить предельное количество неисправных секторов, выше которого жесткий диск подлежит снятию с эксплуатации. По статистическим данным, неисправное состояние наблюдается у 10% флэш накопителей. Примем, что отношение стоимостей пропуска цели и ложной тревоги , и откажемся от «вознаграждения» правильных решений (С11=С22=0). Из условия (4) получаем Варианты задания: Вывод
Метод позволяет оценить вероятность принятия ошибочного решения определяется как минимизация точки экстремума среднего риска ошибочных решений при максимуме правдоподобия, т.е. проводится расчет минимального риска происхождения события при наличии информации о максимально подобных событиях. ПРАКТИЧЕСКАЯ РАБОТА № 3
МЕТОД БАЙЕСА
Среди методов технической диагностики метод, основанный на обобщенной формуле Байеса, занимает особое место благодаря простоте и эффективности. Разумеется, метод Байеса имеет недостатки: большой объем предварительной информации, «угнетение» редко встречающихся диагнозов и др. Однако в случаях, когда объем статистических данных позволяет применить метод Байеса, его целесообразно использовать как один из наиболее надежных и эффективных. Пусть имеется диагноз D i и простой признак k j , встречающийся при этом диагнозе, то вероятность совместного появления событий (наличие у объекта состояния D i и признака k j) Из этого равенства вытекает формула Байеса Очень важно определить точный смысл всех входящих в эту формулу величин: P(D i) – вероятность диагноза D i , определяемая по статистическим данным (априорная вероятность диагноза). Так, если предварительно обследовано N объектов и у N i объектов имелось состояние D i , то P
(k j
/ D i
)– вероятность появления признакаk j у объектов с состоянием D i . Если среди N i объектов, имеющих диагноз D i , у N ij , проявился признак k j , то P
(k j
)– вероятность появления признакаk j во всех объектах независимо от состояния (диагноза) объекта. Пусть из общего числа N объектов признак k j был обнаружен у N j объектов, тогда Для установления диагноза специальное вычисление P(k j) не требуется. Как будет ясно из дальнейшего, значения P(D i) и P(k j /D v), известные для всех возможных состояний, определяют величину P(k j). В равенстве (2) P(D i / k j) – вероятность диагноза D i после того, как стало известно наличие у рассматриваемого объекта признака k j (апостериорная вероятность диагноза). Обобщенная формула Байеса относится к случаю, когда обследование проводится по комплексу признаков K, включающему признаки k 1 , k 2 , …, k ν . Каждый из признаков k j имеет m j разрядов (k j1 , k j2 , …, k js , …, k jm). В результате обследования становится известной реализация признака и всего комплекса признаков К * . Индекс * , как и раньше, означает конкретное значение (реализацию) признака. Формула Байеса для комплекса признаков имеет вид где P(D i / K *) – вероятность диагноза D i после того, как стали известны результаты обследования по комплексу признаков K; P(D i) – предварительная вероятность диагноза D i (по предшествующей статистике). Формула (7) относится к любому из n возможных состояний (диагнозов) системы. Предполагается, что система находится только в одном из указанных состояний и потому В практических задачах нередко допускается возможность существования нескольких состояний A 1 , …, A r , причем некоторые из них могут встретиться в комбинации друг с другом. Тогда в качестве различных диагнозов D i следует рассматривать отдельные состояния D 1 = A 1 , …, D r = A r и их комбинации D r+1 = A 1 /\ A 2 . Перейдем к определению P
(K
* / D i
) . Если комплекс признаков состоит из н признаков, то где k
* j
= k js
– разряд признака, выявившийся в результате обследования. Для диагностически независимых признаков; В большинстве практических задач, особенно при большом числе признаков, можно принимать условие независимости признаков даже при наличии существенных корреляционных связей между ними. Вероятность появления комплекса признаков K * Обобщенная формула Байеса может быть записана где P(K * / D i) определяется равенством (9) или (10). Из соотношения (12) вытекает что, разумеется, и должно быть, так как один из диагнозов обязательно реализуется, а реализация одновременно двух диагнозов невозможна. Следует обратить внимание на то, что знаменатель формулы Байеса для всех диагнозов одинаков. Это позволяет сначала определить вероятности совместного появления i-го диагноза и данной реализации комплекса признаков и затем апостериорную вероятность диагноза Для определения вероятности диагнозов по методу Байеса необходимо составить диагностическую матрицу (табл. 1), которая формируется на основе предварительного статистического материала. В этой таблице содержатся вероятности разрядов признаков при различных диагнозах. Таблица 1 Если признаки двухразрядные (простые признаки «да – нет»), то в таблице достаточно указать вероятность появления признака P(k j / D i). Вероятность отсутствия признака P
(k j
/ D i
) = 1 − P
(k j
/ D i
) . Однако более удобно использовать единообразную форму, полагая, например, для двухразрядного признака P
(kj
/D
) = P
(kj
1/D
) ; P
(k j
/D
) = P
(kj
2/D
). Отметим, что ∑P
(k js
/ D i
) =1 , где m j – число разрядов признака k j . Сумма вероятностей всех возможных реализаций признака равна единице. В диагностическую матрицу включены априорные вероятности диагнозов. Процесс обучения в методе Байеса состоит в формировании диагностической матрицы. Важно предусмотреть возможность уточнения таблицы в процессе диагностики. Для этого в памяти ЭВМ следует хранить не только значения P(k js / D i), но и следующие величины: N – общее число объектов, использованных для составления диагностической матрицы; N i - число объектов с диагнозом D i ; N ij – число объектов с диагнозом D i , обследованных по признаку k j . Если поступает новый объект с диагнозом D μ , то проводится корректировка прежних априорных вероятностей диагнозов следующим образом: Далее вводятся поправки к вероятностям признаков. Пусть у нового объекта с диагнозом D μ выявлен разряд r признака k j . Тогда для дальнейшей диагностики принимаются новые значения вероятности интервалов признака k j при диагнозе D μ: Условные вероятности признаков при других диагнозах корректировки не требуют. Практическая часть 1.Изучить методические указания и получить задание. ПРАКТИЧЕСКАЯ РАБОТА № 4
Лабораторная работа 2 «Эксплуатация и диагностика опор контактной сети»
Цель работы:
ознакомиться со способами определения коррозионного состояния железобетонной опоры контактной сети Порядок выполнения работы
: 1) Изучить и составить краткий отчет о работе прибора АДО-3. 2) Изучить и решить задачу по методу минимального риска (согласно вариантам (по номеру в журнале) 3) Рассмотреть спец.вопрос о способах диагностики состояния опор (за исключением угла наклона). П.п. 1 и 3 выполняются бригадой в количестве 5 человек.
П.2 выполняется индивидуально каждым студентом.
В результате необходимо сделать индивидуальный электронный отчет и прикрепить его в blackboard. Метод минимального риска
При наличии неопределенности принятия решения применяют специальные методы, учитывающие вероятностную природу событий. Они позволяют назначать границу поля допуска параметра для принятия решения о диагностировании. Пусть производится диагностика состояния железобетонной опоры вибрационным методом. Вибрационный метод (рис 2.1) основан на зависимости декремента затухающих колебаний опоры от степени коррозии арматуры. Опора приводится в колебательное движение, например, при помощи троса оттяжки и сбрасывающего устройства. Сбрасывающее устройство калибруется на заданное усилие. На опоре устанавливается датчик колебаний, например акселерометр. Декремент затухающих колебаний определяется как логарифм отношения амплитуд колебаний: где А 2 и А 7 – амплитуды, соответственно второго и седьмого колебаний. а) схема б) результат измерений Рисунок 2.1 – Вибрационный метод АДО-2М измеряет амплитуды колебаний 0,01 ... 2,0 мм частотой 1 ... 3 Гц. Чем больше степень коррозии, тем быстрее затухают колебания. Недостатком метода является то, что декремент колебаний в большой степени зависит от параметров грунта, способа заделки опоры, отклонений технологии изготовления опоры, качества бетона. Заметное влияние коррозии проявляется лишь при значительном развитии процесса. Задача стоит в выборе значения Хо параметра Х таким образом, чтобы при Х>Хо принимали решение о замене опоры, а при Х<Хо не проводили управляющего воздействия. Декремент колебаний опоры зависит не только от степени коррозии, но и от множества других факторов. Поэтому можно говорить о некоторой области, в которой может находиться величина декремента. Распределения декремента колебаний для исправной и прокорродировавшей опоры показано на рис. 2.2. Рисунок 2.2 - Плотность вероятности декремента колебаний опоры Существенно, что области исправного D
1 и коррозионного D
2 состояний пересекаются и потому невозможно выбрать x 0 так, чтобы правило (2.2) не давало бы ошибочных решений. Ошибка первого рода
- принятие решения о наличии коррозии (дефекта), когда в действительности опора (система) находится в исправном состоянии. Ошибка второго рода
- принятие решения об исправном состоянии, тогда как опора (система) прокорродировала (содержит дефект). Вероятность ошибки первого рода равна произведению вероятностей двух событий: вероятности наличия исправного состояния и вероятности того, что x > x 0 при исправном состоянии: где P(D 1) = P 1 - априорная вероятность нахождения опоры в исправном состоянии (считается известной на основании предварительных статистических данных). Вероятность ошибки второго рода: Если известны цены ошибок первого и второго рода c и y соответственно, то можно записать уравнение для среднего риска: Найдем граничное значение x 0 для правила (2.5) из условия минимума среднего риска. Подставляя (2.6) и (2.7) в (2.8) дифференцируя R(x) по x 0 , приравняем производную нулю: Это условие для нахождения двух экстремумов - максимума и минимума. Для существования минимума в точке x = x 0 вторая производная должна быть положительной: Это приводит к следующему условию: Если распределения f(x/D 1) и f(x/D 2) одномодальные, то при: условие (4.58) выполняется. Если плотности распределений параметров исправной и неисправной (системы) подчинены закону Гаусса, то они имеют вид: Условия (2.7) в этом случае принимает вид: После преобразования и логарифмирования получаем квадратное уравнение b = c = Решая уравнение (2.14) можно найти такую величину x 0 , при которой достигается минимум риска. Исходные данные:
Исправное состояние:
Математическое ожидание: Вероятность исправного состояния системы: Среднеквадратичное отклонение: Приведенные затраты на исправное состояние: Неисправное состояние:
Математическое ожидание: ; Предположим, что ЛПР (лицо, принимающее решения) рассматривает несколько возможных решений: i = 1,…,m.
Ситуация, в которой действует ЛПР, является неопределенной. Известно лишь, что наличествует какой-то из вариантов: j = 1,…, n. Если будет принято i -e решение, а ситуация есть j -я, то фирма, возглавляемая ЛПР, получит доход q ij .
Матрица Q = (q ij) называется матрицей последствий (возможных решений). Какое же решение нужно принять ЛПР? В этой ситуации полной неопределенности могут быть высказаны лишь некоторые рекомендации предварительного характера. Они не обязательно будут приняты ЛПР.
Многое будет зависеть, например, от его склонности к риску. Но как оценить риск в данной схеме?
Пример №1
. Пусть матрица последствий есть
Правило Вальда
(правило крайнего пессимизма). Рассматривая i -e решение будем полагать, что на самом деле ситуация складывается самая плохая, т.е. приносящая самый малый доход a i Но теперь уж выберем решение i 0 с наибольшим a i0 . Итак, правило Вальда рекомендует принять решение i0 , такое что Правило Сэвиджа
(правило минимального риска). При применении этого правила анализируется матрица рисков R = (rij) . Рассматривая i -e решение будем полагать, что на самом деле складывается ситуация максимального риска b i = max
Правило Гурвица
(взвешивающее пессимистический и оптимистический подходы к ситуации). Принимается решение i , на котором достигается максимум
Пример №2
. Рассмотрим пример решения статистической игры в экономической задаче.
значит оптимальной по данному критерию является стратегия А3 – продавать в весенние месяцы. Пример №2
. В обычной стратегической игре каждый игрок предпринимает именно те действия, которые наиболее выгодны ему и менее выгодны противнику. При этом предполагается, что игроки – разумные и антагонистические противники. Однако очень часто присутствует неопределенность, которая не связана с сознательным противодействием противника, а зависит от некоторой объективной действительности.
Пример 9.
Фирма производит пользующиеся спросом детские платья и костюмы, реализация которых зависит от состояния погоды. Затраты фирмы в течение августа-сентября на единицу продукции составили: платья – 7 ден. ед., костюмы – 28 ден. ед. Цена реализации составляет 15 и 50 ден. ед. соответственно. По данным наблюдений за несколько предыдущих лет, фирма может реализовать в условиях теплой погоды 1 950 платьев и 610 костюмов, а при прохладной погоде – 630 платьев и 1 050 костюмов.
Пример 2
. Объединение производит разведку полезных ископаемых на трех месторождениях. Фонд средств объединения составляет 30 ден. ед. Деньги в первое месторождение M 1
могут быть вложены в количестве, кратном 9 ден. ед., во второе M 2
– 6 ден. ед., в третье M 3
– 15 ден. ед. Цены на полезные ископаемые в конце планового периода могут оказаться в двух состояниях: C 1
и C 2
. Эксперты установили, что в ситуации C 1
прибыль от месторождения M 1
составит 20 % от количества вложенных ден. ед. на разработку, на M 2
– 12 % и на M 3
– 15 %. В ситуации C 1
на конец планового периода прибыль составит 17 %, 15 %, 23 % на месторождениях M 1
, M 3
, M 3
соответственно.
Пример 3
. Ожидается наступление наводнения, которое может иметь категорию с первой по пятую. Величина ущерба от наводнения: Пример
. Планирование выпуска продукции при разных состояниях природы - рынка спроса.
Пример
. Фирма планирует реализацию своей продукции на рынках, учитывая возможные варианты покупательского спроса П j , j=1,4 (низкий, средний, высокий, очень высокий). На предприятии разработано три стратегии сбыта товаров A 1 , А 2 , А 3 . Объем товарооборота (ден.ед.), зависящий от стратегии и покупательского спроса, представлен в таблице. Решение
находим с помощью калькулятора .
Руководство компании принимает решение о размещении производства нового продукта в некотором месте. Чтобы сформировать представление о ситуации на рынке нового продукта на момент освоения производства, ему необходимо учесть затраты на доставку готовой продукции до потребителя, развитость транспортной и социальной инфраструктуры региона, конкуренцию на рынке, соотношение спроса и предложения, курсы валют и многое другое. Возможные варианты решений, инвестиционная привлекательность которых определяется как процент прироста дохода по отношению к сумме капитальных вложений, представлены в таблице.
(8.1.)
Вар.
X 1 мм.
X 2 мм.
б1
б2
. (2.2)
, (2.3)
, (2.4)
= 0, (2.6)
. (2.7)
. (2.8)
. (2.9)
(2.10)
, (2.11)
. (2.12)
. (2.13)
, (2.14)
;
.
Допустим, мы хотим оценить риск, который несет i -e решение. Нам неизвестна реальная ситуация. Но если бы ее знали, то выбрали бы наилучшее решение, т.е. приносящее наибольший доход. Т.е. если ситуация есть j -я, то было бы принято решение, дающее доход q ij .
Значит, принимая i -e решение мы рискуем получить не q j , а только q ij , значит принятие i -го решения несет риск недобрать r ij = q j - q ij . Матрица R = (r ij) называется матрицей рисков.
Составим матрицу рисков. Имеем q 1 = max(q i 1) = 8, q 2 = 5, q 3 = 8, q 4 = 12.. Следовательно, матрица рисков есть
Принятие решений в условиях полной неопределенности
Не все случайное можно "измерить" вероятностью. Неопределенность – более широкое понятие. Неопределенность того, какой цифрой вверх ляжет игральный кубик отличается от неопределенности того, каково будет состояние российской экономики через 15 лет. Кратко говоря, уникальные единичные случайные явления связаны с неопределенностью, массовые случайные явления обязательно допускают некоторые закономерности вероятностного характера.
Ситуация полной неопределенности характеризуется отсутствием какой бы то ни было дополнительной информации. Какие же существуют правила-рекомендации по принятию решений в этой ситуации?
Так, в вышеуказанном примере, имеем a 1 = 2, a 2 = 2, a 3 = 3, a 4 = 1. Из этих чисел максимальным является число 3. Значит, правило Вальда рекомендует принять 3-е решение.
Но теперь уж выберем решение i 0 с наименьшим b i0 . Итак, правило Сэвиджа рекомендует принять решение i 0 , такое что
В рассматриваемом примере имеем b 1 = 8, b 2 = 6, b 3 = 5, b 4 = 7 . Минимальным из этих чисел является число 5. Т.е. правило Сэвиджа рекомендует принять 3-е решение., где 0 ≤ λ ≤ 1 .
Значение λ выбирается из субъективных соображений. Если λ приближается к 1, то правило Гурвица приближается к правилу Вальда, при приближении λ к 0, правило Гурвица приближается к правилу "розового оптимизма" (догадайтесь сами, что это значит). В вышеуказанном примере при λ = 1/2 правило Гурвица рекомендует 2-е решение.Принятие решений в условиях частичной неопределенности
Предположим, что в рассматриваемой схеме известны вероятности pj того, что реальная ситуация развивается по варианту j . Именно такое положение называется частичной неопределенностью. Как здесь принимать решение? Можно выбрать одно из следующих правил.
Правило максимизации среднего ожидаемого дохода. Доход, получаемый фирмой при реализации i -го решения, является случайной величиной Qi с рядом распределения
qi1
qi2
…
qin
p1
p2
…
pn
Математическое ожидание M и есть средний ожидаемый доход, обозначаемый . Правило рекомендует принять решение, приносящее максимальный средний ожидаемый доход.
Предположим, что в схеме из предыдущего примера вероятности есть (1/2, 1/6, 1/6, 1/6). Тогда Q
1 =29/6, Q
2 =25/6, Q
3 =7, Q
4 =17/6. Максимальный средний ожидаемый доход равен 7, соответствует третьему решению.
Правило минимизации среднего ожидаемого риска. Риск фирмы при реализации i -го решения, является случайной величиной R i с рядом распределения
ri1
ri2
…
rin
p1
p2
…
pn
Математическое ожидание M и есть средний ожидаемый риск, обозначаемый также R
i . Правило рекомендует принять решение, влекущее минимальный средний ожидаемый риск.
Вычислим средние ожидаемые риски при указанных выше вероятностях. Получаем R
1 =20/6, R
2 =4, R
3 =7/6, R
4 =32/5. Минимальный средний ожидаемый риск равен 7/6, соответствует третьему решению.
Анализ принимаемых решений по двум критериям: среднему ожидаемому доходу и среднему ожидаемому риску и нахождение решений, оптимальных по Парето, аналогично анализу доходности и риска финансовых операций. В примере множество решений, оптимальных по Парето операций, состоит только из одного 3-его решения.
В случае, если количество Парето-оптимальных решений больше одного, то для определения лучшего решения применяется взвешивающая формула f(Q)=2Q
-R
.
Правило Лапласа
Иногда в условиях полной неопределенности применяют правило Лапласа, согласно которому все вероятности p j считают равными. После этого можно выбрать какое-нибудь из двух приведенных выше правил-рекомендаций принятия решений.
Сельскохозяйственное предприятие может реализовать некоторую продукцию:
А1) сразу после уборки;
А2) в зимние месяцы;
А3) в весенние месяцы.
Прибыль зависит от цены реализации в данный период времени, затратами на хранение и возможных потерь. Размер прибыли, рассчитанный для разных состояний-соотношений дохода и издержек (S1, S2 и S3), в течение всего периода реализации, представлен в виде матрицы (млн. руб.)
Определить наиболее выгодную стратегию по всем критериям (критерий Байеса, критерий Лапласа, максиминный критерий Вальда, критерий пессимизма-оптимизма Гурвица, критерий Ходжа-Лемана, критерий минимаксного риска Сэвиджа), если вероятности состояний спроса: 0,2; 0,5; 0,3; коэффициент пессимизма С = 0,4; коэффициент достоверности информации о состояниях спроса u = 0,6.
S1
S2
S3
A1
2
-3
7
A2
-1
5
4
A3
-7
13
-3
Решение
Результаты расчетов будем заносить в таблицу:
S1
S2
S3
Б
НО
ММ
П-О
Х-Л
А1
2
-3
7
1
2
-3
3
-0,6
А2
-1
5
4
3,5
2,7
-1
2,6
1,7
А3
-7
13
-3
4,2
1
-7
5
-0,28
p j
0,2
0,5
0,3
А3
А2
А2
А3
А2
1. Критерий Байеса (максимального математического ожидания)
Расчет осуществляется по формуле:
;
W 1 = 2∙0,2 + (-3) ∙0,5 + 7∙0,3 = 0,4 – 1,5 + 2,1 = 1
W 2 = -1∙0,2 + 5 ∙0,5 + 4∙0,3 = -0,2 + 2,5 + 1,2 = 3,5
W 3 = -7∙0,2 + 13 ∙0,5 + (-3)∙0,3 = -1,2 + 6,5 - 0,9 = 4,2
Найденные значения заносим в первый столбец (Б) и выбираем максимальное
W = max{1;3.5;4.2} = 4.2,
2. Критерий недостаточного основания Лапласа (НО)
Находим среднее значение элементов каждой строки:
.
;
;
.
Найденные значения заносим во второй столбец (НО) и выбираем максимальное W = max{2; 2.7; 1} = 2.7, значит оптимальной по данному критерию является стратегия А2 – продавать в зимние месяцы.
3. Максиминный критерий Вальда (ММ)
В каждой строке находим минимальный элемент: .
W 1 = min{2; -3; 7} = -3
W 2 = min{-1; 5; 4} = -1
W 3 = min{-7; 13; -3} = -7
Найденные значения заносим в третий столбец (ММ) и выбираем максимальное W= max{-3; -1; 7} = -1, значит оптимальной по данному критерию является стратегия А2 – продавать в зимние месяцы.
4. Критерий пессимизма-оптимизма Гурвица (П-О)
Для каждой строки рассчитываем значение критерия по формуле: .
По условию C = 0.4, значит:
W 1 = 0,4∙min{2; -3; 7} + (1-0,4) ∙ max{2; -3; 7} = 0,4∙(-3) + 0,6∙7 = -1,2 + 4,2 = 3
W 2 = 0,4∙min{-1; 5; 4} + (1-0,4) ∙ max{-1; 5; 4} = 0,4∙(-1) + 0,6∙5 = -0,4 + 3 = 2,6
W 3 = 0,4∙min{-7; 13; -3} + (1-0,4) ∙ max{-7; 13; -3} = 0,4∙(-7) + 0,6∙13 = -2,8 + 7,2 = 5
Найденные значения заносим в четвертый столбец (П-О) и выбираем максимальное W = max{3; 2.6 5} = 5, значит оптимальной по данному критерию является стратегия А3 – продавать в весенние месяцы.
5. Критерий Ходжа-Лемана (Х-Л)
Для каждой строки рассчитываем значение критерия по формуле: .
По условию u = 0.6 и множители в каждом слагаемом уже рассчитаны, их можно взять их первого столбика (Б) и из третьего столбика (ММ), значит:
W 1 = 0,6∙1 + (1-0,6) ∙(-3) = 0,6 – 1,2 = -0,6
W 2 = 0,6∙3,5 + (1-0,6) ∙(-1) = 2,1 – 0,4 = 1,7
W 3 = 0,6∙4,2 + (1-0,6) ∙(-7) = 2,52 – 2,8 = -0,28
Найденные значения заносим в пятый столбец (Х-Л) и выбираем максимальное W = max{-0.6; 1.7; -0.28} = 1.7, значит оптимальной по данному критерию является стратегия А2 – продавать в зимние месяцы.
5. Критерий минимаксного риска Сэвиджа
Рассчитаем матрицу рисков. Заполнять ее лучше по столбцам. В каждом столбце находим максимальный элемент и вы читаем из него все остальные элементы столбца, результаты записываем на соответствующих местах.
Вот как рассчитывается первый столбец. Максимальный элемент в первом столбце: a 11 = 2, значит по формуле :
r 11 = 2 – a 11 = 2 -2 = 0
r 21 = 2 – a 21 = 2 –(-1) = 3
r 31 = 2 – a 31 = 2 –(-7) = 9
Рассчитаем второй столбец матрицы рисков. Максимальный элемент во втором столбце: a 32 = 13, значит:
r 12 = 13 – a 12 = 13 –(-3) = 16
r 22 = 13 – a 22 = 13 –5 = 8
r 32 = 13 – a 32 = 13 –13 = 0
Рассчитаем третий столбец матрицы рисков. Максимальный элемент в третьем столбце: a 13 = 7, значит:
r 13 = 7 – a 13 = 7 –7 = 0
r 23 = 7 – a 23 = 7 –4 = 3
r 33 = 7 – a 33 = 7 –(-3) = 10
Таким образом, матрица рисков имеет вид (в каждом столбце на месте максимального элемента платежной матрицы должен стоять ноль):
Дополним матрицу рисков рассчитанными значениями критерия W i – в каждой строке выбираем максимальный элемент ():
W i
0
16
0
16
3
8
3
8
9
0
10
10
W 1 = max{0; 16; 0} = 16
W 2 = max{3; 8; 3} = 8
W 3 = max{9; 0; 10} = 10
Найденные значения заносим в столбец (W i) и выбираем минимальное W = min{16,8,10} = 8, значит оптимальной по данному критерию является стратегия А2 – продавать в зимние месяцы.
Вывод:
Сельскохозяйственное предприятие имеет три участка земли: влажный, средней влажности и сухой. Один из этих участков предполагается использовать для выращивания картофеля, остальные – для посева зеленой массы. Для получения хорошего урожая картофеля требуется определенное количество влаги в почве в период вегетации. При излишней влажности посаженый картофель на некоторых участках может гнить, а при недостаточном количестве осадков будет плохо развиваться, что приводит к снижению урожайности. Определить, на каком участке сеять картофель, чтобы получить хороший урожай его, если известна средняя урожайность картофеля на каждом участке в зависимости от погодных условий. На участке A 1
урожайность составляет 200, 100 и 250 ц с 1 га при выпадении соответственно нормального количества осадков, больше и меньше нормы. Аналогично на участке A 2
– 230, 120 и 200 ц, а на участке A 3
– 240, 260 и 100 ц.
Используем игровой подход. С/х предприятие – игрок A
, у которого три стратегии: A 1
– сеять картофель на влажном участке, A 2
– на участке средней влажности, A 3
– на сухом участке. Игрок П
– природа, у которого три стратегии: П 1
соответствует количеству осадков меньше нормы, П 2
– норме, П 3
– больше нормы. Выигрыш с/х предприятия при каждой паре стратегий (A i
, П j
) задается урожайностью картофеля с 1 га.
Рассмотрим общую ситуацию, когда какой-то стороне необходимо выполнить операцию в недостаточно известной обстановке. О состоянии этой обстановки можно сделать n
предположений: П 1
, П 2
,…, П n
. Например, покупательский спрос. По аналогии с примером 8 эти состояния рассматривают как стратегии природы. В теории статистических игр природа не является разумным игроком, она рассматривается как некая незаинтересованная инстанция, которая не выбирает для себя оптимальных стратегий. Ее возможные состояния реализуются случайным образом. Такие ситуации принято называть играми с природой.
Оперирующая сторона A
в своем распоряжении имеет m
возможных стратегий: A 1
, A 2
,…, A m
. Выигрыши игрока A
при каждой паре стратегий A i
и П j
предполагаются известными a ij
.
П
A
П 1
П 2
П 3
A 1
250
200
100
A 2
200
230
120
A 3
100
240
260
Может показаться, что игра с природой проще стратегической игры, поскольку природа не противодействует игроку A
. На самом деле это не так, поскольку в неопределенной ситуации труднее принять обоснованное решение. Хотя выиграет A
, скорее всего, больше, чем в игре против сознательного противника.
Составить платежную матрицу.
Решение.
У фирмы две стратегии: A 1
: выпустить продукцию, считая, что погода будет теплой; A 2
: выпустить продукцию, считая, что погода будет прохладной.
У природы две стратегии: B 1
: погода теплая; B 2
: погода прохладная.
Найдем элементы платежной матрицы:
1) a 11 – доход фирмы при выборе стратегии A 1
при условии B 1
:
a 11 =(15-7)·1950+(50-28)·610=29020.
2) a 12 – доход фирмы при выборе A 1
при условии B 2
. Фирма выпустит 1 950 платьев, а продаст 630, доход от реализации платьев
(15-7)·630-7·(1950-630)=5040-9240
a 12 =5040-9240+22·610=9220.
3) аналогично при стратегии A 2
в условиях B 1
фирма выпустит 1 050 костюмов, а продаст 610;
a 21 =8·630+22·610-28·(1050-610)=6140
4) a 22 =8·630+22·1050=28140
Платежная матрица:20 020
9 220
6 140
28 140
Игрок A
– объединение. Игрок П
(природа) – совокупность внешних обстоятельств, которые обуславливают ту или иную прибыль на месторождениях. У игрока A
имеется четыре возможности, полностью использующие имеющиеся средства. Первая стратегия, A
1 , состоит в том, что A
вложит в M
1 9 ден. ед., в M
2 – 6 ден. ед., в M
3 – 15 ден. ед. Вторая стратегия A
2: в M
1 – 18 ден. ед., в M
2 – 12 ден. ед., в M
3 деньги не вкладывать. Третья стратегия, A
3: 30 ден. ед. вложить в M
3 . Четвертая стратегия, A
4:. 30 ден. ед. вложить в M
2 . Кратко можно записать A
1 (9, 6, 15), A
2 (18, 12, 0), A
3 (0, 0, 30), A
4 (0, 30, 0).
Природа может реализовать одно из двух своих состояний, характеризующихся различными ценами на полезные ископаемые в конце планового периода. Обозначим состояния природы П
1 (20 %, 12 %, 15 %), П
2 (17 %, 15 %, 23 %).
Элементы a ij платежной матрицы имеют смысл суммарной прибыли, получаемой объединением в различных ситуациях (A i
, П j
) (i
=1, 2, 3, 4, j
= 1, 2). Например, вычислим a
12 , отвечающий ситуации (A 1
, П 2
), т. е. случаю, когда объединение вкладывает в месторождения M
1 , M
2 , M
3 , соответственно 9 ден. ед., 6 ден. ед., 15 ден. ед., и на конец планового периода цены оказались в состоянии C 2
:
a 12
= 9·0,17+6·0,15+15·0,23 = 5,88 ден. ед.
В качестве профилактического действия можно построить дамбу; имеется пять вариантов выбора высоты дамбы: h 1
< h 2
< h 3
< h 4
< h 5
, причем дамба высоты h 1
защищает только от наводнения первой категории, высоты h 2
– от наводнения первой и второй категории, и т. д., дамба высоты h 5
защищает от наводнения любой категории.
Категория наводнения
1
2
3
4
5
Ущерб, ден. ед.
5
10
13
16
20
Затраты на строительство дамбы:
Принимающий решение имеет шесть стратегий (не строить дамбу вообще (A 0
) или строить дамбу высоты h i
(A i
), i
= 1, 2, 3, 4, 5). Природа также имеет шесть стратегий (не осуществлять наводнение (П 0
) или осуществить наводнение j
-й категории (П j
), 1≤j≤5).
Высота дамбы
h 1
h 2
h 3
h 4
h 5
Затраты, ден. ед.
2
4
6
8
10
Получаем матрицу потерь:
Например, если построить дамбу высоты h 2
, а наводнение будет третьей категории, то затраты на строительство составят 4 ден. ед., а ущерб от наводнения 13 ден. ед. Таким образом, общие потери составят 4 + 13 = 17 ден. ед. Если же наводнение будет второй категории, то ущерба от наводнения не будет, и потери связаны только со строительством дамбы, т.е. 4 ден. ед
П / A
П 0
П 1
П 2
П 3
П 4
П 5
A 0
0
5
10
13
16
20
A 1
2
2
12
15
18
22
A 2
4
4
4
17
20
24
A 3
6
6
6
6
22
26
A 4
8
8
8
8
8
28
A 5
10
10
10
10
10
10
Чтобы из матрицы потерь (b ij
) получить матрицу выигрышей, достаточно у всех элементов поменять знак и прибавить любую константу C
(в данном случае C
можно интерпретировать как сумму, выделенную на строительство дамбы, тогда выигрыш a ij =C-b ij представляет собой сэкономленную сумму). Например, при C =30 матрица выигрышей:
П
/ A
П 0
П 1
П 2
П 3
П 4
П 5
A 0
30
25
20
17
14
10
A 1
28
28
18
15
12
8
A 2
26
26
26
13
10
6
A 3
24
24
24
24
8
4
A 4
22
22
22
22
22
2
A 5
20
20
20
20
20
20
Игры с "природой"
Термин "природа" в теории игр понимается в широком смысле
. Это могут быть действительные природные физические (климатические), биологические, химические, социальные и т.п. процессы, которые сопровождают экономическую деятельность. Под "природой" может также пониматься рынок, противостоящий предпринимателю, конкурирующая среда, монополия и т.п. "Природа" может выступать как антагонистическая сторона, а может как кооперативная среда. "Природа" в виде природных процессов, как часть экономики, не стремиться "специально" навредить предпринимателю, но она несёт определённый урон от его экономической деятельности и этот "проигрыш"для неё должен быть минимален
, если, вообще, без него для окружающей среды нельзя обойтись. Игрок A в таких играх - это экономические субъекты, а игрок B - это "природа". Откуда средства у физической "природы"? Проигрыш игрока B, физической "природы", должен компенсироваться из вне, например, государственными дотациями либо заложенными в инвестиционные проекты средствами на возобновление природных ресурсов. Знание оптимальных стратегий "природы" позволяет определить наиболее неблагоприятные условия для игрока A (предпринимателя), которые его ожидают ("надейся на лучшее, но готовься к худшему"), и оценить необходимые ресурсы на восстановление природных ресурсов, дающих ему возможность получить гарантированный доход.
Если "природа" подразумевает конкурентную среду - то проигрыш второго игрока есть цена борьбы с конкурентами на рынке.
Перейдём к примерам содержательных постановок задач игры с "природой".
1. Антагонистические игры
Пример 1. (Планирование посевов)
. Фермер, имеющий ограниченный участок земельных угодий, может его засадить тремя различными культурами A 1, A 2, A 3 . Урожай этих культур зависит главным образом от погоды ("природы"), которая может находиться в трёх различных состояниях: B 1 , B 2 , B 3 . Фермер имеет информацию (статистические данные) о средней урожайности этих культур (количество центнеров культуры, получаемого в одного гектара земли) при трёх различных состояниях погоды, которая отражена в таблице:
Тогда матрица доходов (платёжная матрица) фермера A имеет вид:
Элемент матрицы A - (a ij)
показывает, какой доход может получить фермер с одного гектара земли, если он посеет культуру i (i =1, 2, 3), а погода будет находиться в состоянии j (j
= 1, 2, 3).
Необходимо определить пропорции, в которых фермер должен засеять имеющийся участок земли, чтобы получить максимальный гарантированный доход вне зависимости от того, какие погодные условия будут реализованы.
Данная задача может быть сведена к антагонистической игре. В данном случае в качестве первого игрока выступает фермер, а в качестве второго игрока - природа. Будем предполагать, что природа, как игрок, может вести себя таким образом, чтобы максимально навредить фермеру, преследуя тем самым противоположные интересы (эти предположения позволяют оценить тот доход, который он может получить в том случае, если погодные условия будут для него максимально неблагоприятные). В этом случае фермер имеет в своём распоряжении три чистые стратегии:
Как игрок, природа может также использовать три возможные стратегии:
Решение
2. Проверим, имеет ли данная игра седловую точку.
V * =max i min j a ij = 50.
V * =min j max i a ij = 100.
3. Решение игры следует искать в смешанных стратегиях. Сведём игровую задачу к задаче линейного программирования. Если первый игрок
- фермер
- применяет свою оптимальную смешанную стратегию P * , а второй игрок
- природа
- применяет последовательно свои чистые стратегии, то математическое ожидание дохода, который фермер может получить со своего участка, будет не меньше цены игры V. .
Разделим равенство:
p* 1 + p* 2 + p* 3 = 1
на V, получим, что новые переменные y 1 , y 2 , y 3 удовлетворяют условию:
y 1 + y 2 + y 3 = 1/V
Поскольку цель первого игрока - максимизация его выигрыша
, а математическое ожидание его выигрыша не меньше цены игры
, то первый игрок будет стремиться максимизировать цену игры, которая эквивалентна минимизации величины 1/V.
Итак, для первого игрока (фермера) задача об определении оптимальной стратегии поведения свелась к задаче линейного программирования:
найти минимум функции F = y 1 + y 2 + y 3
и прямых ограничениях:
y 1 ≥ 0, y 2 ≥ 0, y 3 ≥ 0
Переходим ко второму игроку, к природе. Если второй игрок - природа
- будет применять свою оптимальную смешанную стратегию
Q * ,а первый игрок - фермер будет последовательно применять свои чистые стратегии, то математическое ожидание проигрыша второго игрока будет не больше цены игры.
Следовательно, должна выполняться следующая система неравенств:
Разделим каждое из неравенств, входящих в систему на V и введём новые переменные:
.
В результате получим новую систему неравенств:
Разделим равенство:
q* 1 + q* 2 + q* 3 = 1
на V, получим, что новые переменные q 1 , q 2 , q 3 удовлетворяют условию:
q 1 + q 2 + q 3 = 1/V
Поскольку цель второго игрока - природы
- минимизация его проигрыша
, а математическое ожидание его проигрыша не больше цены игры
, то второй игрок будет стремиться минимизировать цену игры, которая эквивалентна максимизации величины 1/V.
Итак, для второго игрока (природы) задача об определении оптимальной стратегии поведения свелась к задаче линейного программирования:
найти максимум функции F / = x 1 + x 2 + x 3
при следующих функциональных ограничениях:
и прямых ограничениях:
x 1 ≥ 0, x 2 ≥ 0, x 3 ≥ 0
Таким образом, для того чтобы найти оптимальную смешенную стратегию второго игрока, необходимо также решить задачу линейного программирования.
Задачи обоих игроков свелись к паре двойственных задач линейного программирования:
Задача второго игрока
минимизация проигрыша V
Задача первого игрока
максимизация выигрыша V
Целевая функция
F / = x 1 +x 2 +x 3 = → max
F = y 1 +y 2 +y 3 = → min
Функциональные ограничения
Прямые ограничения
x 1 ≥ 0, x 2 ≥ 0, x 3 ≥ 0
y 1 ≥ 0, y 2 ≥ 0, y 3 ≥ 0
Задача первого игрока решается симплекс-методом . Результаты счёта:
Выводы
. В соответствии с полученными результатами фермеру гарантирован средний доход в размере 66,67 единиц
с каждого гектара используемой под культурами земли при самых неблагоприятных условиях. Оптимальная стратегия
для него - выращивание двух культур, A 1 и A 3
, причём, под первую культуру
ему следует отвести 0,67
часть всей земли
, а под третью культуру 0,33 часть всей земли
.
Природа "грозит" фермеру жарой 0,33 часть сезона возделывания культур и 0,67 часть сезона дождями.
Предприятие может выпускать 4 вида продукции: A 1 , A 2 , A 3 , A 4 , получая при этом прибыль. Её величина определяется состоянием спроса (природой рынка), который может находиться в одном из четырёх возможных состояний: B 1 , B 2 , B 3 , B 4 . Зависимость величины прибыли от вида продукции и состояния рынка представлено в таблице: Виды продукции
Возможные состояния рынка спроса
B 1
B 2
B 3
B 4
A 1
4
3
5
6
A 2
2
6
1
5
A 3
3
0
7
2
A 4
3
5
1
3
Платёжная матрица имеет вид:
Элемент матрицы A - {a ij
} характеризует, какую прибыль может получить предприятие, если оно будет выпускать i
- й вид продукции(i
=1, 2, 3, 4) при j-м спросе(j
= 1, 2, 3, 4).
Необходимо определить оптимальные пропорции выпускаемых предприятием видов продукции, продажа которой обеспечила бы ему максимально возможную выручку вне зависимости от того, какое состояние спроса будет реализовано
Эта задача может быть сведена к антагонистической игре.
В данном случае в качестве первого игрока
выступает предприятие
, а в качестве второго игрока
- природа
, которая влияет на состояние спроса и может сделать его максимально неблагоприятным для предприятия. Будем предполагать, что природа, как игрок, будет вести себя таким образом, чтобы максимально навредить предприятию, преследуя тем самым противоположные интересы.
В этом случае конфликт двух сторон может характеризоваться, как антагонистический, а использование модели этого конфликта позволяет предприятию. оценить выручку, которую оно может получить вне зависимости от того, какое состояние спроса будет реализовано.
Выступая в качестве первого игрока
, предприятие
может использовать четыре стратегии:
· первую чистую стратегию, соответствующую выпуску предприятием только продукции A 1
· вторую чистую стратегию, соответствующую выпуску предприятием только продукции A 2
· третью чистую стратегию, соответствующую выпуску предприятием только продукции A 3
· четвёртую чистую стратегию, соответствующую выпуску предприятием только продукции A 4
Выступая в качестве второго игрока
, природа
может использовать также четыре стратегии:
· первую чистую стратегию, при которой реализуется состояние спроса B 1 ;
· вторую чистую стратегию, при которой реализуется состояние спроса B 2 ;
· третью чистую стратегию, при которой реализуется состояние спроса B 3 ;
· четвёртую чистую стратегию, при которой реализуется состояние спроса B 4 .
Решение
1. Проанализируем платёжную матрицу A.
Матрица A не имеет доминируемых стратегий и не может быть упрощена.
2. Проверим, имеет ли данная игра седловую точку .
Найдём нижнюю и верхнюю цену игры:
V * =max i min j a ij = 3.
V * =min j
max i a ij = 4.
Поскольку V * ≠V * , то данная антагонистическая игра не имеет седловой точки и решения в чистых стратегиях.
Решение игры следует искать в смешанных стратегиях. Сведём рассматриваемый антагонистический конфликт к прямой и двойственной задаче линейного программирования.
Если первый игрок
- предприятие
- применяет
свою оптимальную
смешанную
стратегию
P * , а второй игрок
- природа
- применяет
последовательно свои чистые стратегии
, то математическое ожидание дохода
, который предприятие может получить, будет не меньше цены игры
V
.
И наоборот, если второй игрок - природа
- будет применять свою оптимальную смешанную стратегию
Q * ,
а первый игрок - предприятие
будет последовательно
применять свои чистые стратегии
, то математическое ожидание проигрыша
второго игрока будет
не больше цены игры
.
Следовательно, должна выполняться следующая система неравенств:
Применяя симплекс-метод для решения задачи первого игрока
, получим:
Задача второго игрока
минимизация проигрыша
V
Задача первого игрока
максимизация выигрыша
V
Целевая функция
F / = x 1 +x 2 +x 3 +x 4 =→ max
F = y 1 +y 2 +y 3 +y 4
=→ min
Функциональные ограничения
Прямые ограничения
x 1 ≥ 0, x 2 ≥ 0, x 3 ≥ 0, x 4
≥ 0
y 1 ≥ 0, y 2 ≥ 0, y 3 ≥ 0, y 4
≥ 0
Y * = (y 1 * = 0,182; y 2 * = 0; y 3 * = 0; y 4 * =0,091)
F= y 1 * + y 2 * + y 3 * +y 4 * = 0,273
Из соотношения y 1 * + y 2 * + y 3 * +y 4 * =1/V найдём V:
Из соотношений:
Найдём:
p* 1 = y* 1 V = 0,67 , p* 2 = y* 2 V = 0 , p* 3 = y* 3 V = 0 , p* 4 = y* 4 V =0,33
Окончательно имеем:
Р * = (р * 1 =0,67; р * 2 = 0; р * 3 =0; р * 4 = 0,33), V = 3.67
На основании решения, найденного для двойственной задачи линейного программирования, найдём решение
исходной задачи - задачи второго игрока:
X * = (x 1 * = 0,121; x 2 * =0,121; x 3 * = 0,03; x 4 * = 0)
F / = x 1 * + x 2 * + x 3 * +x 4 * = 0,273
Из соотношения x 1 * + x 2 * + x 3 * +x 4 * = 1/V найдём V:
Из соотношений:
Найдём:
q* 1 = x* 1 V = 0,445 , q* 2 = x* 2 V = 0,444 , q* 3 = x* 3 V = 0,111 , q* 4 = x* 4 V = 0.
Окончательно имеем:
Q * = (q * 1 = 0,445; q * 2 =0,444; q * 3 = 0,111; q * 4 = 0), V = 3.67
где N=3
А j
П j
П 1
П 2
П 3
П 4
А 1
30 +N
10
20
25 + N/2
А 2
50
70 - N
10 + N/2
25
А 3
25 – N/2
35
40
60 - N/2
Критерий Байеса
.
По критерию Байеса за оптимальные принимается та стратегия (чистая) A i , при которой максимизируется средний выигрыш a или минимизируется средний риск r.
Считаем значения ∑(a ij p j)
∑(a 1,j p j) = 33 0.3 + 10 0.2 + 20 0.4 + 26.5 0.1 = 22.55
∑(a 2,j p j) = 50 0.3 + 67 0.2 + 11.5 0.4 + 25 0.1 = 35.5
∑(a 3,j p j) = 23.5 0.3 + 35 0.2 + 40 0.4 + 58.5 0.1 = 35.9 A i
П 1
П 2
П 3
П 4
∑(a ij p j)
A 1
9.9
2
8
2.65
22.55
A 2
15
13.4
4.6
2.5
35.5
A 3
7.05
7
16
5.85
35.9
p j
0.3
0.2
0.4
0.1
Критерий Лапласа
.
Если вероятности состояний природы правдоподобны, для их оценки используют принцип недостаточного основания Лапласа, согласно которого все состояния природы полагаются равновероятными, т.е.:
q 1 = q 2 = ... = q n = 1/n.
q i = 1/4
Вывод: выбираем стратегию N=3. A i
П 1
П 2
П 3
П 4
∑(a ij)
A 1
8.25
2.5
5
6.63
22.38
A 2
12.5
16.75
2.88
6.25
38.38
A 3
5.88
8.75
10
14.63
39.25
p j
0.25
0.25
0.25
0.25
Критерий Вальда
.
По критерию Вальда за оптимальную принимается чистая стратегия, которая в наихудших условиях гарантирует максимальный выигрыш, т.е.
a = max(min a ij)
Критерий Вальда ориентирует статистику на самые неблагоприятные состояния природы, т.е. этот критерий выражает пессимистическую оценку ситуации.
Вывод: выбираем стратегию N=3. A i
П 1
П 2
П 3
П 4
min(a ij)
A 1
33
10
20
26.5
10
A 2
50
67
11.5
25
11.5
A 3
23.5
35
40
58.5
23.5
Критерий Севиджа
.
Критерий минимального риска Севиджа рекомендует выбирать в качестве оптимальной стратегии ту, при которой величина максимального риска минимизируется в наихудших условиях, т.е. обеспечивается:
a = min(max r ij)
Критерий Сэвиджа ориентирует статистику на самые неблагоприятные состояния природы, т.е. этот критерий выражает пессимистическую оценку ситуации.
Находим матрицу рисков.
Риск
– мера несоответствия между разными возможными результатами принятия определенных стратегий. Максимальный выигрыш в j-м столбце b j = max(a ij) характеризует благоприятность состояния природы.
1. Рассчитываем 1-й столбец матрицы рисков.
r 11 = 50 - 33 = 17; r 21 = 50 - 50 = 0; r 31 = 50 - 23.5 = 26.5;
2. Рассчитываем 2-й столбец матрицы рисков.
r 12 = 67 - 10 = 57; r 22 = 67 - 67 = 0; r 32 = 67 - 35 = 32;
3. Рассчитываем 3-й столбец матрицы рисков.
r 13 = 40 - 20 = 20; r 23 = 40 - 11.5 = 28.5; r 33 = 40 - 40 = 0;
4. Рассчитываем 4-й столбец матрицы рисков.
r 14 = 58.5 - 26.5 = 32; r 24 = 58.5 - 25 = 33.5; r 34 = 58.5 - 58.5 = 0;
A i
П 1
П 2
П 3
П 4
A 1
17
57
20
32
A 2
0
0
28.5
33.5
A 3
26.5
32
0
0
Вывод: выбираем стратегию N=3. A i
П 1
П 2
П 3
П 4
max(a ij)
A 1
17
57
20
32
57
A 2
0
0
28.5
33.5
33.5
A 3
26.5
32
0
0
32
Критерий Гурвица
.
Критерий Гурвица является критерием пессимизма - оптимизма. За (оптимальную принимается та стратегия, для которой выполняется соотношение:
max(s i)
где s i = y min(a ij) + (1-y)max(a ij)
При y = 1 получим критерий Вальде, при y = 0 получим – оптимистический критерий (максимакс).
Критерий Гурвица учитывает возможность как наихудшего, так и наилучшего для человека поведения природы. Как выбирается y? Чем хуже последствия ошибочных решений, тем больше желание застраховаться от ошибок, тем y ближе к 1.
Рассчитываем s i .
s 1 = 0.5 10+(1-0.5) 33 = 21.5
s 2 = 0.5 11.5+(1-0.5) 67 = 39.25
s 3 = 0.5 23.5+(1-0.5) 58.5 = 41
Вывод: выбираем стратегию N=3. A i
П 1
П 2
П 3
П 4
min(a ij)
max(a ij)
y min(a ij) + (1-y)max(a ij)
A 1
33
10
20
26.5
10
33
21.5
A 2
50
67
11.5
25
11.5
67
39.25
A 3
23.5
35
40
58.5
23.5
58.5
41
Таким образом, в результате решения статистической игры по различным критериям чаще других рекомендовалась стратегия A 3 .
Выбрать:
1) место для размещения производства, если руководитель предприятия уверен в том, что на рынке сложится ситуация 4;
2) место для размещения производства, если руководство оценивает вероятность ситуации 1 в 0,2; ситуации 2 в 0,1; ситуации 3 в 0,25;
3) провести выбор варианта в условиях неопределенности по критерию: максимакс, максимин, критерий Лапласа, критерий Сэведжа, критерий Гурвица (y = 0,3);
4) изменится ли наилучший вариант решения по критерию Гурвица если величину a увеличить до 0,5?
5) предположив, что данные таблицы представляют затраты предприятия, определить выбор, который сделает предприятие при использовании каждого из следующих критериев: максимин; максимакс; критерий Гурвица(? = 0,3); критерий Сэведжа; критерий ЛапласаТиповые задания
0.07
0.26
0.11
0.25
0.1
0.21
68
45
54
79
47
99
56
89
42
56
74
81
72
87
56
40
62
42
65
48
75
89
52
80
69
93
93
56
45
43
73
94
79
68
67
46
66
100
64
89
94
49
70
42
97
42
42
50
x=0,7
А j
П j
П 1
П 2
П 3
П 4
А 1
30 +N
10
20
25 + N/2
А 2
50
70 - N
10 + N/2
25
А 3
25 – N/2
35
40
60 - N
Где N=3
Известны возможные состояния покупательского спроса, которые соответственно q 1 =0,3, q 2 =0,2, q 3 =0,4, q 4 =0,1. Необходимо найти стратегию сбыта, максимизирующую средний товарооборот фирмы. При этом использовать критерии Вальда, Гурвица, Сэвиджа, Байеса.
Решение