Раздел 9. Принятие решений в условиях неопределенности

9.4 Планирование эксперимента в условиях неопределенности

Планирование эксперимента в условиях неопределенности

Если априорной информации нет или она ненадёжна, то можно путём проведения эксперимента получить более надёжные данные о вероятности 𝚀j. Под экспериментом понимают систему мероприятий позволяющих уточнить информацию о состоянии природы. Насколько может помочь в принятии решения эксперимент и как сопоставить стоимость эксперимента с тем оптимальным выигрышем, который мы получим?

Соответствующую теорию можно построить исходя из знания вероятности 𝚀j, а так же из знания на основе критериев при неизвестной априорной информации. Мы рассмотрим когда есть априорная информация, т. е. ситуацию идеального наблюдателя. Появляется вопрос: есть ли смысл проводить эксперимент? Возможны два случая:

1) Идеальный эксперимент. Результат этого эксперимента однозначно определяет каковы условия природы. Пусть заданы выигрыши aij и априорные вероятности 𝚀j. Стоимость эксперимента сопоставима с aij , т. е. имеют одинаковую размерность. Сравним средний выигрыш без проведения эксперимента со средним выигрышем при проведении эксперимента:

Нет эксперимента:

Если мы проведём эксперимент, то мы точно узнаем Pj = Pk , и тогда найдя в k - ом столбце максимальный выигрыш, мы найдём наш выигрыш:

Но нам нужно оценить эффективность эксперимента до его проведения, поэтому мы должны ориентироваться на средний ожидаемый выигрыш, который мы получим, если будем проводить эксперимент. Таким образом, после эксперимента мы можем ожидать выигрыш . Поэтому чтобы решить, проводить эксперимент или нет, надо определить, что больше: amax или .

Получается, что мы будем проводить эксперимент, если:

B преобразовав это неравенство, получим:

2) Неидеальный эксперимент. В результате проведения эксперимента мы не находим однозначно Pj , а лишь изменяем вероятность 𝚀j . Пусть проводится неидеальный эксперимент. В результате появляются некоторые несовместные события 𝛽1, 𝛽2,…, 𝛽k. Вероятности этих событий зависят от условий, в которых они проводятся. Пусть известны P(Bl /Pj). Эти вероятности называются прямыми. После эксперимента, давшего исход Bl необходимо пересмотреть вероятности 𝚀j , т. е. вместо вероятности 𝚀j мы перейдём к вероятности 𝚀jl . Это так называемые апостериорные вероятности:

Но результаты эксперимента могут быть и Bl и B2 и Bk, поэтому мы можем только ожидать всякие исходы Bl, которые получатся в результате эксперимента. Причём, каждый исход Bl привёл бы к некоторым оптимальным стратегиям A*l . А величина выигрыша, которая бы при этом получилась:

Эти выигрыши , могут произойти с вероятностью события Bl, т. е. это вероятность P(Bl). У нас их нет, но их можно получить по формуле полной вероятности:

Тогда ожидаемый выигрыш будет:

Можно рассмотреть случай, когда проводят 2 ,3,4,... эксперимента. Их при этом считают независимыми.

Многоэтапное принятие решений.

Мы рассмотрели различные критерии принятия решений в условиях неопределённости. На практике, в таких задачах как, проектирование изделий, программ, мы можем столкнуться с принятием последовательных решений. Особое значение вот такие многоэтапные решения имеют при создании автоматизированных экспертных систем. Рассмотрим вопрос оптимизации многоэтапных решений. Многоэтапность приводит к тому, что схема принятия решения может быть представлена в виде дерева, в каждой вершине которого осуществляется либо:

1) Сознательный выбор между двумя и более альтернативами

2) Случайный переход из одной ветви в другую под воздействием внешних факторов

Рассмотрим пример оптимизации многоэтапных решений на примере экономической задачи.

Пример: фирма может принять решение о строительстве крупного или мелкого предприятия. Строительство крупного предприятия относительно дешевле, в случае если будет высокий спрос на производимые товары, мелкое предприятие можно расширить. Деятельность фирмы рассматривается в течение десяти лет, причём в случае строительства мелкого предприятия, вопрос о расширении будет рассматриваться через два года. Спрос заранее неизвестен.

Введём градацию спроса: высокий (p > 0.75) и низкий (p < 0.25). Затраты и доходы:

Cтроительство крупного предприятия – 5 млн. $; строительство мелкого – 1 млн. $; затраты на расширение – 4,2 млн.$; крупное предприятие при высоком спросе даёт доход – 1 млн. $ ежегодно, а при низком – 300 тыс.$; мелкое предприятие при высоком спросе – 250 тыс. $ ежегодно, при низком – 200 тыс.$; расширенное предприятие в случае высокого спроса приносит доход – 900 тыс.$ в год, и при низком спросе – 200 тыс.$; мелкое предприятие без расширения при высоком спросе на производимый продукт приносит в течение двух лет по 250 тыс.$ ежегодно, а в течение следующих восьми по 200 тыс.$. Нарисуем наше дерево.

Применим для решения этой задачи метод динамического программирования. В качестве критерия применим средний выигрыш, т. е. МО выигрыша. Сама величина критерия равна доходу без затрат на строительство. Начнём с последнего четвёртого шага: подсчитаем средний выигрыш:


Исходя из полученного результата, оптимальным будем сразу строить крупное предприятие.

Задача о секретарше

Директор собирается принять на работу секретаршу. Прежний опыт делит секретарш на три категории: отличных (3 балла), хороших (2 балла) и посредственных (1 балл). Анализ учебных заведений по подготовке секретарш даёт статистику выпускниц заведений: вероятность взять на работу отличную секретаршу – 0,2, хорошую – 0,5, посредственную – 0,3. директор может испытать только трёх претенденток, причём в случае отказа директора кандидат убывает на другую работу. Построим дерево решений.

Начнём искать оптимальное решение с последнего шага. Определим МО «выигрыша» секретарши, если мы испытываем трёх кандидаток:

3 = 3 × 0.2 + 2 × 0.5 + 1 × 0.3 = 1.9

3 = 3 × 0.2 + 2 × 0.5 +1.9 × 0.3 = 2.17

Во втором испытании, если попалась хорошая секретарша, надо остановиться, а в первом испытании, надо остановиться только если попалась отличная, а в третье испытании берём любую. Найдём средний оптимальный выигрыш после всех испытаний:

отл = 3 × 0.2 + 2.17 × 0.5 + 2.17 × 0.3 = 2.336