Як працюють автономні автомобілі
Безпілотний автомобіль має сприйняти світ, зрозуміти його, спрогнозувати, що інші учасники зроблять далі, і обчислити безпечний шлях — і все це протягом 100 мілісекунд. Ось інженерний конвеєр, який це забезпечує.
1. Рівні автономності SAE
2. Сенсори: очі автомобіля
| Сенсор | Дальність | Переваги | Недоліки |
|---|---|---|---|
| LiDAR | 0.1–200 м | Точна 3D-хмара точок, працює в темряві, без розмиття від руху | Дорогий, розсіювання в дощ/сніг, без кольору |
| Радар | 0.5–300 м | Працює в тумані/дощі, безпосередньо вимірює швидкість (Доплер), дешевий | Низька роздільність, відбивні завади |
| Камера | 0.1–150 м | Багата семантична інформація, працює на дальності світлофора, дешева | Без глибини, чутлива до освітлення та засвічення |
| Ультразвук | 0.1–8 м | Дешевий, дуже надійне виявлення в ближній зоні | Лише дуже мала дальність |
| Високоточний GPS | Глобальна | Абсолютне положення (сантиметровий рівень з RTK) | Немає сигналу в тунелях/щільних міських каньйонах, затримка 100 мс |
3. Злиття сенсорів
Жоден окремий сенсор не є надійним за всіх умов. Злиття сенсорів поєднує всі вхідні дані в узгоджену модель світу. Поширені підходи:
- Фільтр Калмана / Розширений фільтр Калмана (EKF): оптимальний лінійний оцінювач, що підтримує розподіл імовірностей положення та швидкості автомобіля, поєднуючи прогнози моделі руху із зашумленими оновленнями від сенсорів.
- Фільтр частинок: непараметричний баєсівський фільтр — представляє розподіли вибірками. Краще для нелінійної, негаусівської невизначеності. Використовується для локалізації на LiDAR-картах.
- Злиття на глибинному навчанні: сучасні системи (Tesla FSD, Waymo 5) зливають сенсори безпосередньо в мережі — на вхід сирі дані сенсорів, на виході 3D-представлення сцени.
4. Локалізація та SLAM
Самого GPS недостатньо — похибка точності в 3 м небезпечна в смузі руху. Системи автономних авто досягають сантиметрової точності, зіставляючи дані сенсорів у реальному часі з картою високої роздільності (HD): LiDAR-хмари точок зіставляються з попередньо побудованою картою за допомогою алгоритмів на кшталт ICP (Iterative Closest Point) чи LOAM (LiDAR Odometry and Mapping).
У незакартованих або змінених середовищах SLAM (одночасна локалізація та картографування) будує карту й локалізує автомобіль водночас — задача «курки і яйця», що розв'язується ймовірнісною оптимізацією графа (pose graph SLAM, iSAM2).
5. Сприйняття: бачення об'єктів
Сприйняття перетворює сирі дані сенсорів на список виявлених об'єктів з класом, положенням, розміром і швидкістю. Сучасні підходи:
- 3D-виявлення об'єктів з LiDAR: PointPillars, VoxelNet — вокселізують хмару точок і застосовують 3D-згортки.
- Виявлення на основі камер: BEVFusion, BEV-Former — проєктують зображення у сітку ознак вигляду згори (Bird's-Eye View, BEV) за допомогою трансформерів. Уможливлюють оцінку глибини з монокулярних камер.
- Сегментація: класифікація на рівні пікселів і точок. Необхідна для виявлення проїзної зони, розпізнавання смуг.
- Сітки зайнятості: ймовірнісна карта того, які 3D-воксели зайняті будь-яким об'єктом — безпечніша за явні списки об'єктів для опрацювання «невідомих невідомих» об'єктів.
6. Прогнозування: що зроблять інші?
Знати, де перебувають інші учасники, недостатньо — потрібно знати, де вони будуть у наступні 5–10 секунд. Це прогнозування руху.
Класичні підходи використовували кінематичні моделі (стала швидкість, стала кутова швидкість). Сучасні системи автономних авто застосовують прогнозування на основі трансформерів (Waymo Motion, MTR):
- Вхід: минулі траєкторії всіх учасників + топологія карти (геометрія смуг, світлофори).
- Вихід: K мультимодальних майбутніх траєкторій з оцінками ймовірності для кожного учасника.
Мультимодальний вихід критично важливий — пішохід може або перейти дорогу, або повернути праворуч. Планувальник має враховувати всі правдоподібні варіанти майбутнього.
7. Планування руху
Планування руху знаходить безконфліктну, комфортну траєкторію від поточного стану до мети. Ключові рівні:
- Планування маршруту: навігація високого рівня (A* по графу доріг).
- Поведінкове планування: вирішує, коли змінювати смугу, поступатися, вливатися. Часто на правилах або вивчених стратегіях.
-
Планування траєкторії: генерує плавний, динамічно
здійсненний шлях за ≤100 мс. Методи:
- Поліноміальні спіралі / оптимізація сплайнів (планувальник у системі Френе, Werling та ін.)
- Швидкорозгалужені випадкові дерева (RRT*)
- Прогностичне керування на основі моделі (MPC) — оптимізує на короткому горизонті з урахуванням динаміки
8. Керування автомобілем
Спланована траєкторія виконується рівнем керування, який подає команди на кермо, газ і гальма. ПІД-регулятор (або каскадний ПІД) поширений для поперечного (кермування) і поздовжнього (швидкість) керування. MPC дає кращу продуктивність, прогнозуючи динаміку приводів і дотримуючись обмежень (ривок, проковзування шин).
Команди проходять через систему drive-by-wire автомобіля до електропідсилювача керма, електронної дросельної заслінки та ABS/ESC. Затримки й час відгуку приводів потрібно моделювати в регуляторі, інакше траєкторія відставатиме.
9. Невирішені виклики
- Рідкісні граничні випадки («довгий хвіст»): розподіл дорожніх ситуацій величезний. Рідкісні події (зустрічний рух, повені, незвичайний вантаж) недостатньо представлені в навчальних даних, але мають опрацьовуватися безпечно.
- Зв'язок V2X: «автомобіль-до-всього» (інші авто, світлофори, пішоходи) може ділитися намірами — але до стандартизованого впровадження ще роки.
- Несприятлива погода: сильний дощ, сніг і пряме засвічення сонцем погіршують сенсори корельовано — усі сенсори відмовляють разом у найгірші моменти.
- Регуляторні та правові рамки: статистична сертифікація безпеки технології без втручання людини юридично безпрецедентна.