Головна

ПРЯМА ПРОЦЕДУРА

  1.  Б. ПРЯМА ЛОПАТА з ковшем СО СУЦІЛЬНИЙ ріжучі кромки
  2.  У якому порядку здійснюється процедура санкціонування?
  3.  У чому полягає процедура консультацій?
  4.  Вертикальної асимптотой графіка функції є пряма
  5.  Види (функціональна і стохастична, пряма і зворотна, прямолінійна і криволінійна) форми взаємозв'язків між явищами.
  6.  Зовнішнє управління як процедура, застосовувана в справі про банкрутство.
  7.  Вибір екскаватора «пряма лопата» для розробки відкритого котловану, розрахунок вибоїв, визначення його продуктивності

Скористаємося результатами назадній процедури для вирішення вихідної задачі, тобто для побудови оптимального управління і оптимальної траєкторії при заданому початковому умови (3). вважаючи t = 0 і х = х ° в (8), знайдемо управління в початковий момент: u (0) = v0(Х °). Далі зі співвідношення (2) визначимо стан х (1) = f (х °, u (0)). Продовжуючи цей процес, знайдемо u (1) = vt(Х (1)), х (2)) і т. д. Взагалі маємо

u (t) = vt(X (t)), x (t + 1) = f (x (t), u (t)),

x (0) = x0, T = 0,1, ..., N-1 (9)

Співвідношення (9) визначають пряму процедуру і дозволяють повністю розрахувати оптимальне управління і оптимальну траєкторію. Мінімальне значення критерію оптимальності, що відповідає цій траєкторії, J = S (x °, 0).

приклад

Як приклад розглянемо модельну задачу про оптимальне функціонування ферми з розведення худоби або птиці. нехай х - Число тварин (або птахів) на фермі на початку деякого інтервалу часу. З цього числа їх тварин відправляється на продаж, а інші тварини приносять приплід, так що їх число зростає в q раз за розглянутий інтервал. Рівняння (2) набуде вигляду

x (t + 1) = q [1-u (t)] x (t), t = 0,1, ...

тут q> 1 - постійний коефіцієнт, и - Керуючий вплив (частка тварин, що відправляються на продаж). Обмеження (1) в даному випадку має вигляд 0 <= u <= 1.

Витрати на утримання тварин приймемо пропорційними їх залишився числу і рівними а [1 - u (1)] х (t) де а > 0 - постійна; Виручку від продажу вважаємо рівній Сu (t) x (t), де с - Ціна однієї тварини на ринку. Поставимо задачу максимізації доходу ферми за N кроків за часом. Як зазначалося вище, ця задача еквівалентна мінімізації збитку (тобто доходу зі знаком мінус). Критерій оптимальності має вигляд (4), де потрібно прийняти відповідно до сказаного вище

 R (x, u) = a (1-u) x-cux, F (х) = - сх. (11)

Остання рівність (11) визначає (зі знаком мінус) вартість тварин на фермі в кінці процесу. З огляду на співвідношення (10) і (11), складемо рівняння (6) для даної задачі

S (x, t) = тin [а (1-й) х-сих + S (q (1-u) x, t + 1)] (12)

 0 <= u <= 1

Умова (7) з урахуванням (11) набуде вигляду

S (x, N) = СГ (13)

Нескладний аналіз дозволяє реалізувати назад процедуру і побудувати функції S (x, t) і відповідні їм управління з (9) для завдання (12), (13). Наведемо остаточні результати:

S (x, t) = a (qN-1-1) (Q-1)-1x-cqN-1 x

vt(X) =0 при a

S(X, t) = - cx vt(X) = 1 при a> c (q-1) (14)

У тому, що функції з (14) задовольняють рівняння (12) і умові (13) при всіх t, можна переконатися шляхом математичної індукції, проводячи її в бік зменшення t і починаючи t = N.

Рішення (14) допускають просту інтерпретацію. якщо а <с (q -1), Тобто витрати на утримання тварин порівняно невеликі, то має сенс не направляти тварин на продаж (U) = 0) і отримати найбільший дохід, зберігши все поголів'я до кінця процесу. Якщо ж а> с (q -1), тобто витрати на утримання великі, то доцільно відправити на продаж відразу всіх тварин. В разі а = с (q - 1) оптимальне управління неєдиним: в цьому випадку будь-яке управління призводить до одного й того ж результату.

Більш складні і більш змістовні результати отримаємо, якщо врахуємо залежність ринкової ціни з від числа продаваних тварин х (Ціна зменшується з ростом х), а також залежність витрат на утримання однієї тварини а від числа тварин на фермі.

безперервної ВИПАДОК.

Розглянемо далі випадок детермінованого динамічного системи з безперервним керуванням без обмеження на стану

управління u (t) вибираємо з класу допустимих, так що u U и

де ? - носить назву "коефіцієнта актуалізації", з математичної точки введення цього коефіцієнта дозволяє розглядати випадок коли T = + ?. "Економічна" інтерпретація цього коефіцієнта стає зрозумілою, якщо врахувати різний внесок величин f (t, u (t), y (t)) через величин t: спочатку і припустити, наприклад, якщо f = 1, т. е., введення коефіцієнта ?, званого коефіцієнтом дисконтування, дозволяє описати інфляційні процеси. визначимо функцію

де функціонал задамо як значення цільової функції для динамічної системи в момент часу t, що займає положення x в фазовому просторі якщо управління u (t) допустимо і відомо.

Реалізуємо безперервний аналог виведення реккурентная состношенія принципу динамічного програмування Беллмана. Нехай на відрізку , ? << 1 реалізовано управління v (s), sI Стан y (t + ?) є спостереження, тоді

Нехай нам відомо оптимальне управління u (s) з моменту t + d

тоді

Тепер на підставі принципу оптимальності Беллмана можна записати

 Де нижня межа визначається за функціями J (.), Які реалізують допустиме управління (яке гарантуватиме перехід системи з точки (X, t) в точку y (t + d) в момент часу t + d).

розкладемо функцію Ф (y (t + d), t + d) за ступенем малого параметра d:

 Винесемо з квадратних дужок величини, від ? не залежать

 Поділимо на ? і перейдемо до межі при ? -> 0, тоді

Це нелінійне рівняння з приватними похідними називається рівнянням динамічного програмування або рівнянням Гамільтона-Якобі-Беллмана. тут

ми скористалися визначенням похідної

для заміни рівнянь руху динамічної системи. залучаючи умова Ф (T, x (T)) = j (x (T)) отримуємо дещо незвичну задачу для визначення функції Ф (x, t):

У математичної теорії оптимального управління встановлюється коректність цього завдання для функції Ф (x, t).

Побудова алгоритму управління вимагає деякого уточнення. Значення оптимального управління в кожен момент часу t є правило (алгоритм) від наявної в цей момент інформації. Якщо динамічна система спостерігалася, то до моменту часу t ми маємо інформацію про стан динамічної системи і управлінням в усі попередні моменти часу. Будемо називати управління зворотним зв'язком, якщо оптимальне значення управління в момент часу t залежить лише від стану ДС в цей момент, т. Е. Від y (t). Одним з основних результатів математичної теорії управління полягає в тому, що при повній спостережливості ДС існує управління, яке є зворотним зв'язком.

У нашому випадку (безперервне управління динамічними системами) синтезується в такий спосіб.

Нехай нижня точна грань в дужках, де u, x вважаються параметрами, реалізується на функції V (x, s) тоді оптимальне управління v (t) можна задати рівністю:

v (t) = V (y (t), t)

Т. е. Управління залежить від поточного стану динамічної системи і тому є зворотним зв'язком!

Якщо розглядати безперервне управління динамічними системами з випадковими чинниками, то рівняння Беллмана приводиться до вигляду

Випадок імпульсного управління. Розглянемо випадок детермінованою ДС з імпульсним керуванням, для простоти без обмежень. Тут постає питання: коли нам вигідно здійснювати керуючий імпульс і яка повинна бути його інтенсивність.

Функціонал якості (критерій) цільова функція записується у вигляді

Розглянемо спочатку інтервал (t, t + ?), вільний від керуючих імпульсів. Тоді визначаючи функцію

Маємо вільні рухи на інтервалі t, t + ?. При цьому

так як нижня межа береться по більш широкому інтервалу [t, T], а не [t + ?, T]!

тоді

(якщо t невільна від імпульсів, то <0!)

Нехай тепер у момент часу t система відчуває миттєвий керуючий імпульс. Значить система з положення x перейшла в стан x + x. До імпульсу була вартість Ф (x, t) після стала Ф (x + xit) + C (x). За визначенням Ф можемо написати:

Для вільної точки ця умова !

А оскільки має в будь-який момент часу tI [t, t + ?] реалізовуватися або одне, або інше, то одна з нерівностей має перейти в рівність, що можна записати у вигляді:

І до нього необхідно додати кінцеве умова

Таким чином імпульсна управління ДС приводить до задачі не для диференціального рівняння, а до задачі для нерівності, званого варіаційним!

Тематика імпульсного управління інтенсивно розвивається. Зокрема є обнадійливі результати в галузі управління виробництвом електроенергії, управління запасами, фінансами, виробництвом сировинними ресурсами, в задачах управління якістю з урахуванням зносу, статистичного управління в фінансах, банківським портфелем (управління акціями), завдання розподілу дивідендів в проблемі розорення.

Приклад.

Застосування імпульсного управління до задачі терапевтичного лікування.

нехай X (t) - "Рівень" хвороби в момент часу t. За відсутності лікування стан хворого еволюціонує відповідно до рівняння:

Розглянемо послідовність моментів в які здійснюється лікування. Кожен акт лікування характеризується його інтенсивністю xi. Поки триває лікування, стан x (t) еволюціонує відповідно до рівнянь:

Однак лікування може зробити шкідливий вплив на організм. Нехай y (t)-ступінь руйнування організму внаслідок лікування. Тоді вважаємо, що стан y (t) еволюціонує відповідно до рівнянь:

Де введені обмеження

Припустимо, що мета лікування полягає в утриманні стану x (t) в межах 0 ? x (t) ? x0. Однак мова йде про те, щоб надмірно не руйнувати організм лікуванням, тобто 0 ? y (t) ? y0.

нехай t - Перший момент, в який x (t), або y (t) виходить з точки x0 або y0. Ми хочемо максимізувати t. З огляду на вартість одного акта лікування (рівну k) ставимо іншу задачу мінімізувати функціонал

де . Другий доданок є ціна лікування, виробленого в момент .

нехай , Тоді ця функція є рішенням задачі

Звідси можна вивести оптимальну стратегію лікування!

Рішення конкретного завдання управління процесом лікування призводять до діаграм, наведених нижче:

Надаємо читачеві в якості невеликого вправи розібратися що ізбражено на них (які показники стану і в які моменти проводиться лікування).



 назаднім ПРОЦЕДУРА |  Поняття про ергатичних системах.

 Лекція 5. Загальні відомості про автоматичні регулятори. Основи теорії автоматичного регулювання. Типи регуляторів. |  Рівняння в варіаціях. |  Лекція 6. Кредо управління. Постановка загальної задачі керування динамічною системою. Зв'язок з варіаційним обчисленням. |  Постановка загальної задачі керування динамічною системою. |  Економічна інтерпретація управління |  Зв'язок з варіаційним обчисленням. |  Принцип максимуму Понтрягіна. |  Лекція 8. Динамічне програмування в задачах управління. |  ПРИНЦИП ОПТИМАЛЬНОСТІ |  МЕТОД ДИНАМІЧНОГО ПРОГРАММИРОВАНИЯ |

© um.co.ua - учбові матеріали та реферати