Класифікація методів прийняття рішень 3 сторінка | Класифікація методів прийняття рішень 4 сторінка | Класифікація методів прийняття рішень 5 сторінка | Класифікація методів прийняття рішень 6 сторінка | Дискретний керований процес | II-2. 1. Постановка завдання прийняття рішень на дискретній керованому процесі | II-2.3. Постановка завдання ухвалення рішень на конечношаговом керованому процесі | II-2.4. Прикладні завдання. Приклади керованих процесів | II-2.5.1. Постановка задачі | II-2.5.2. Марковський процес |

загрузка...
загрузка...
На головну

II-2.5.4. Принцип оптимальності Беллмана

  1. B) Конституційні принципи
  2. Gl] Тема 4. [:] Правовий договір, загальновизнані принципи і норми міжнародного права в правовій системі Республіки Казахстан
  3. II-2.5.5. рівняння Беллмана
  4. II-2.5.6. Рішення рівняння Беллмана
  5. II. Принципи формування, функції та повноваження робочих груп очного (на базі освітньої організації), заочного муніципального та заочного регіонального етапів Конкурсу
  6. Oсновні принципи побудова назв Сполука з аніоннімі, катіоннімі та нейтральних комплексами

Розглянемо марковский керований детермінований багатокроковий процес (II.8) і завдання його оптимізації (II.9) з адитивною функцією цілі (II.10).

Припустивши, що завдання (II.9) з цільовою функцією (II.10) має рішення. Тоді справедливий принцип оптимальності Беллмана:

оптимальна стратегія , Володіє тим властивістю, що які б не були стан системи на будь-якому етапі і управляє рішення , Прийняте в цьому стані, наступні управлінські рішення повинні складати оптимальну стратегію відносного стану , Отриманого в результаті керуючого рішення , Тобто стану, до якого прийде система в кінці цього етапу.

Доведення. позначимо через

 (II.13)

оптимальну стратегію, є вирішення завдань (1.9),

 (II.14)

відповідає їй оптимальну траєкторію.

Виберемо на оптимальної траєкторії деяку точку  (Стан системи) і розглянемо  -шаговий процес, що починається зі стану :

 (II.15)

ефективність управління яким будемо оцінювати цільової функцією

(II.16)

де,  - Управління (стратегія)  - Кроковим процесом (II.15). Зокрема, при прийнятті в стані  керуючого рішення  система перейде в стан

Завдання оптимізації на процесі (II.15) ставиться так само, як і завдання для всього процесу (II.8).

позначимо через

 (II.17)

оптимальне управління (стратегію) для процесу (II.15) з цільовою функцією (II.16). Тоді в прийнятих позначеннях принцип оптимальності Беллмана для процесу (II.15) запишеться наступним чином: для оптимальності стратегії  (II.17) необхідно, щоб для будь-якого стану системи  і будь-якого керуючого рішення  , Прийнятого в цьому стані, наступні управлінські рішення

 склали оптимальну стратегію для N-k- Крокової процесу, який починається зі стану  . Припустимо, що це твердження не так, тобто стратегія  оптимальна для  - Крокової процесу (II.15), а управління  - Кроковим процесом  не оптимальне щодо його початкового стану

Це означає, що існує таке управління N-k- Кроковим процесом  , Що починається зі стану  , що

 (II.18)

Очевидно, що управління  є допустимим керуванням  - Кроковим процесом, начінающімя зі стану  . Оцінимо ефективність управління  , Використовуючи (II.18) і адитивність цільової функції

 (II.19)

Порівнюючи крайні члени отриманого строгої нерівності, отримуємо, що стратегія  краще стратегії  , А це суперечить припущенню про оптимальність стратегії  . Таким чином, припущення про неоптимальности стратегії  є невірним. Затвердження доведено.

 



II-2.5.3. Способи завдання цільової функції | II-2.5.5. рівняння Беллмана
загрузка...
© um.co.ua - учбові матеріали та реферати