Сучасна теорія керування
Класичне ПІД-керування підлаштовує три числа для одного контуру зворотного зв'язку. Сучасна теорія керування переформульовує задачу мовою матричної алгебри: описати повний стан системи, з'ясувати, які входи забезпечують бажану динаміку, та спроєктувати оптимальний регулятор, що мінімізує функцію вартості — усе одночасно.
1. Подання в просторі станів
Будь-яку ЛСЧ (лінійну стаціонарну) систему можна записати у формі простору станів. Вектор стану x(t) містить мінімальну інформацію, потрібну для передбачення майбутньої поведінки:
Приклад — обернений маятник на візку: стан x = [cart_pos, cart_vel, angle, angular_vel]ᵀ, вхід u = [force]. A — це лінеаризована динаміка навколо вертикальної нестійкої рівноваги.
Версія для дискретного часу: x[k+1] = Ax[k] + Bu[k]. Власні значення A визначають стійкість: для неперервного часу система стійка тоді й лише тоді, коли всі власні значення мають від'ємні дійсні частини; для дискретного часу — тоді й лише тоді, коли всі власні значення лежать усередині одиничного кола.
2. Керованість і спостережуваність
Дві фундаментальні структурні властивості визначають, чи взагалі можливі керування та оцінювання:
Якщо система не повністю керована, на деякі моди не можна вплинути входом — вони некеровані. Якщо вони стійкі, система є «стабілізовною», і ми все одно можемо проєктувати корисні регулятори. Аналогічно, неспостережувані стійкі моди є прийнятними (система є «виявною»).
3. Розміщення полюсів
За умови повного зворотного зв'язку за станом u = −Kx (ми вимірюємо або оцінюємо всі стани) система із замкненим контуром стає:
Розміщення полюсів: оберіть бажані власні значення (полюси) для системи із замкненим контуром. Потім знайдіть матрицю підсилення K, що розміщує власні значення туди. Це розв'язує формула Аккермана (для SISO-систем) або алгоритми призначення власних значень (для MIMO).
Де слід розміщувати полюси? Кожне власне значення σ ± jω дає моду зі швидкістю згасання σ (для стійкості має бути від'ємною) і частотою коливань ω. Швидкі полюси → швидкий відгук, але великі зусилля керування. Емпіричні правила:
- Домінантні полюси ≈ бажана смуга пропускання замкненого контуру
- Додаткові полюси ≈ у 3–10 разів далі ліворуч (швидкі, не домінантні)
- Уникайте розміщення полюсів надто далеко ліворуч — це вимагає великого підсилення та чутливе до похибки моделі
4. Лінійно-квадратичний регулятор (LQR)
Розміщення полюсів вимагає вгадування розташувань полюсів. LQR прибирає вгадування: знаходить підсилення K, що мінімізує квадратичну функцію вартості на нескінченному часі:
Q штрафує великі відхилення стану; R штрафує великі зусилля керування. Збільшення Q_ii → швидший відгук для стану i (ціною агресивнішого входу). Збільшення R → повільніший, м'якший відгук. Отримане K оптимальне для цього компромісу, а система із замкненим контуром (A−BK) гарантовано стійка для будь-яких додатно визначених Q, R.
Підказка щодо налаштування: поширена відправна точка — Q = C'C (штраф виходів) і R = αI. Зменшуйте α, щоб отримати агресивніше керування. Це часто легше інтуїтивно налаштувати, ніж розміщувати полюси напряму.
5. Спостерігач Люенбергера
На практиці ми не вимірюємо повний стан — лише y = Cx + шум. Спостерігач Люенбергера відновлює x̂ (оцінку x) із минулих входів і вимірюваних виходів:
Спроєктуйте L так, щоб власні значення (A−LC) були стійкими та швидкими. За дуальністю це точно як розміщення полюсів, але транспоноване. Полюси спостерігача слід розмістити в ~2–5 разів швидшими за полюси регулятора, щоб оцінювач збігся ще до того, як стане важливим запізнення регулятора.
Як альтернатива, оберіть L за дуальністю LQR — дуальний оптимальний спостерігач є фільтром Калмана, з L = PCᵀR_n⁻¹, де P розв'язує дуальне рівняння Ріккаті, а R_n — це коваріація шуму вимірювання.
6. LQG — спостерігач + регулятор
Поєднання керування LQR зі спостерігачем-фільтром Калмана дає лінійно-квадратичний гаусів (LQG) регулятор — золотий стандарт лінійного оптимального керування:
Принцип розділення: за припущень LQG (лінійна система, гаусів шум) оптимальний регулятор і оптимальний оцінювач можна проєктувати незалежно та поєднувати. u = −Kx̂.
Обмеження LQG: не робастний до невизначеності моделі — може стати нестійким за малих збурень. LQG з відновленням передачі контуру (LQG/LTR) або H∞-керування додають гарантії робастності.
7. Застосування
- Керування дроном / квадрокоптером: стан = [x,y,z, vx,vy,vz, крен,тангаж,рискання, ω_x,ω_y,ω_z]. LQR є стандартом для стабілізації висоти й орієнтації.
- Обернений маятник / балансувальні роботи: канонічна нестійка система. LQR здатен балансувати в реальному часі навіть зі значним запізненням.
- Спуск місячного модуля Apollo (LEM): керування в просторі станів + оцінки фільтра Калмана живили бортовий комп'ютер наведення.
- Керування хімічними процесами: реактори зі станами температури, концентрації, тиску. LQG з інтегральною дією для відстеження уставки.
- Автономні транспортні засоби: поперечне керування (кермування), поздовжнє керування (газ/гальмо), поєднані з фільтром Калмана GPS/IMU для оцінювання стану.