УМК Теория принятия решений

Раздел 9. Принятие решений в условиях неопределенности

9.4 Планирование эксперимента в условиях неопределенности

Планирование эксперимента в условиях неопределенности

Если априорной информации нет или она ненадёжна, то можно путём проведения эксперимента получить более надёжные данные о вероятности 𝚀_j. Под экспериментом понимают систему мероприятий позволяющих уточнить информацию о состоянии природы. Насколько может помочь в принятии решения эксперимент и как сопоставить стоимость эксперимента с тем оптимальным выигрышем, который мы получим?

Соответствующую теорию можно построить исходя из знания вероятности 𝚀_j, а так же из знания на основе критериев при неизвестной априорной информации. Мы рассмотрим когда есть априорная информация, т. е. ситуацию идеального наблюдателя. Появляется вопрос: есть ли смысл проводить эксперимент? Возможны два случая:

1) Идеальный эксперимент. Результат этого эксперимента однозначно определяет каковы условия природы. Пусть заданы выигрыши a_ij и априорные вероятности 𝚀_j. Стоимость эксперимента сопоставима с a_ij, т. е. имеют одинаковую размерность. Сравним средний выигрыш без проведения эксперимента со средним выигрышем при проведении эксперимента:

Нет эксперимента:

Если мы проведём эксперимент, то мы точно узнаем P_j= P_k, и тогда найдя в k - ом столбце максимальный выигрыш, мы найдём наш выигрыш:

Но нам нужно оценить эффективность эксперимента до его проведения, поэтому мы должны ориентироваться на средний ожидаемый выигрыш, который мы получим, если будем проводить эксперимент. Таким образом, после эксперимента мы можем ожидать выигрыш . Поэтому чтобы решить, проводить эксперимент или нет, надо определить, что больше: a_max или .

Получается, что мы будем проводить эксперимент, если:

B преобразовав это неравенство, получим:

2) Неидеальный эксперимент. В результате проведения эксперимента мы не находим однозначно P_j, а лишь изменяем вероятность 𝚀_j. Пусть проводится неидеальный эксперимент. В результате появляются некоторые несовместные события 𝛽₁, 𝛽₂,…, 𝛽_k. Вероятности этих событий зависят от условий, в которых они проводятся. Пусть известны P(B_l /P_j). Эти вероятности называются прямыми. После эксперимента, давшего исход B_l необходимо пересмотреть вероятности 𝚀_j, т. е. вместо вероятности 𝚀_j мы перейдём к вероятности 𝚀_jl . Это так называемые апостериорные вероятности:

Но результаты эксперимента могут быть и B_l и B₂ и B_k, поэтому мы можем только ожидать всякие исходы B_l, которые получатся в результате эксперимента. Причём, каждый исход B_l привёл бы к некоторым оптимальным стратегиям A^*_l . А величина выигрыша, которая бы при этом получилась:

Эти выигрыши , могут произойти с вероятностью события B_l, т. е. это вероятность P(B_l). У нас их нет, но их можно получить по формуле полной вероятности:

Тогда ожидаемый выигрыш будет:

Можно рассмотреть случай, когда проводят 2 ,3,4,... эксперимента. Их при этом считают независимыми.

Многоэтапное принятие решений.

Мы рассмотрели различные критерии принятия решений в условиях неопределённости. На практике, в таких задачах как, проектирование изделий, программ, мы можем столкнуться с принятием последовательных решений. Особое значение вот такие многоэтапные решения имеют при создании автоматизированных экспертных систем. Рассмотрим вопрос оптимизации многоэтапных решений. Многоэтапность приводит к тому, что схема принятия решения может быть представлена в виде дерева, в каждой вершине которого осуществляется либо:

1) Сознательный выбор между двумя и более альтернативами

2) Случайный переход из одной ветви в другую под воздействием внешних факторов

Рассмотрим пример оптимизации многоэтапных решений на примере экономической задачи.

Пример: фирма может принять решение о строительстве крупного или мелкого предприятия. Строительство крупного предприятия относительно дешевле, в случае если будет высокий спрос на производимые товары, мелкое предприятие можно расширить. Деятельность фирмы рассматривается в течение десяти лет, причём в случае строительства мелкого предприятия, вопрос о расширении будет рассматриваться через два года. Спрос заранее неизвестен.

Введём градацию спроса: высокий (p > 0.75) и низкий (p < 0.25). Затраты и доходы:

Cтроительство крупного предприятия – 5 млн. $; строительство мелкого – 1 млн. $; затраты на расширение – 4,2 млн.$; крупное предприятие при высоком спросе даёт доход – 1 млн. $ ежегодно, а при низком – 300 тыс.$; мелкое предприятие при высоком спросе – 250 тыс. $ ежегодно, при низком – 200 тыс.$; расширенное предприятие в случае высокого спроса приносит доход – 900 тыс.$ в год, и при низком спросе – 200 тыс.$; мелкое предприятие без расширения при высоком спросе на производимый продукт приносит в течение двух лет по 250 тыс.$ ежегодно, а в течение следующих восьми по 200 тыс.$. Нарисуем наше дерево.

Применим для решения этой задачи метод динамического программирования. В качестве критерия применим средний выигрыш, т. е. МО выигрыша. Сама величина критерия равна доходу без затрат на строительство. Начнём с последнего четвёртого шага: подсчитаем средний выигрыш:

Исходя из полученного результата, оптимальным будем сразу строить крупное предприятие.

Задача о секретарше

Директор собирается принять на работу секретаршу. Прежний опыт делит секретарш на три категории: отличных (3 балла), хороших (2 балла) и посредственных (1 балл). Анализ учебных заведений по подготовке секретарш даёт статистику выпускниц заведений: вероятность взять на работу отличную секретаршу – 0,2, хорошую – 0,5, посредственную – 0,3. директор может испытать только трёх претенденток, причём в случае отказа директора кандидат убывает на другую работу. Построим дерево решений.

Начнём искать оптимальное решение с последнего шага. Определим МО «выигрыша» секретарши, если мы испытываем трёх кандидаток:

a̅₃ = 3 × 0.2 + 2 × 0.5 + 1 × 0.3 = 1.9

a̅₃ = 3 × 0.2 + 2 × 0.5 +1.9 × 0.3 = 2.17

Во втором испытании, если попалась хорошая секретарша, надо остановиться, а в первом испытании, надо остановиться только если попалась отличная, а в третье испытании берём любую. Найдём средний оптимальный выигрыш после всех испытаний:

a̅_отл = 3 × 0.2 + 2.17 × 0.5 + 2.17 × 0.3 = 2.336

Предыдущая лекция | Следующая лекция