🤖 Машинне навчання · ШІ
📅 Березень 2026 ⏱ ≈ 8 хв читання 🟢 Початковий–середній рівень

Що таке машинне навчання?

Машинне навчання — це наука про те, як змусити комп'ютери навчатися з даних без явного програмування. Розуміння трьох основних парадигм — керованого, некерованого навчання та навчання з підкріпленням — плюс компромісу зсув–дисперсія достатньо, щоб ясно міркувати майже про будь-яку ML-систему у продакшені.

Що насправді робить машинне навчання

Класичне програмне забезпечення бере на вхід явні правила й видає відповіді. Машинне навчання перевертає це: воно бере приклади (входи + правильні відповіді) і видає правила (модель, що може відповідати на нові запитання).

Традиційно: правила + дані → відповіді
ML: дані + відповіді → правила (модель)

Технічно ML знаходить функцію f таку, що f(x) ≈ y для всіх навчальних пар (x, y), а потім узагальнює на небачені значення x.

Кероване навчання

Найпоширеніша парадигма. Кожен навчальний приклад має розмічену відповідь. Алгоритм мінімізує різницю між своїми прогнозами та цими мітками.

📊

Регресія

Прогнозувати неперервне число. Ціни на житло, температура, дохідність акцій.

🏷️

Класифікація

Прогнозувати категорію. Спам/не спам, кіт/пес, хвороба/немає хвороби.

🔢

Ранжування

Упорядкувати елементи за релевантністю. Результати пошуку, стрічки рекомендацій.

Поширені алгоритми: лінійна/логістична регресія, дерева рішень, випадкові ліси, дерева з градієнтним бустингом (XGBoost), опорні векторні машини та нейронні мережі.

Некероване навчання

Без міток — алгоритм має сам знайти структуру в даних. Він групує схожі приклади, стискає представлення або виявляє аномалії, не маючи підказки про «правильну відповідь».

Навчання з підкріпленням

Агент виконує дії в середовищі й отримує винагороди. Мета — навчитися стратегії (правилу вибору дій), що максимізує сукупну винагороду з часом.

На відміну від керованого навчання, тут немає пар (x, y) — агент має сам відкрити, які дії ведуть до винагороди, шляхом проб і помилок, часто з тривалими затримками між дією та винагородою.

Застосування: ШІ для ігор (AlphaGo, OpenAI Five), пересування роботів, оптимізація охолодження центрів обробки даних, RLHF (донавчання мовних моделей бути корисними та безпечними).

Прочитайте повний детальний розбір: Навчання з підкріпленням простими словами →

Компроміс зсув–дисперсія

Кожну похибку прогнозу моделі можна розкласти на:

Похибка = Зсув² + Дисперсія + Невід'ємний шум
Недонавчання
Високий зсув
Якраз
Збалансовано
Перенавчання
Висока дисперсія

Збільшення складності моделі (більше параметрів, вищий степінь полінома) знижує зсув, але підвищує дисперсію. Мистецтво ML — знайти оптимальну точку з урахуванням обсягу доступних даних.

Перенавчання та регуляризація

Перенавчена модель дуже добре працює на навчальних даних, але погано на нових прикладах — вона «запам'ятала», а не «навчилася».

Поширені способи виправлення

Як моделі узагальнюють

Узагальнення — це головна загадка ML. Надпараметризовані моделі — як-от GPT-3 на 175 мільярдів параметрів, навчений на трильйоні токенів — за класичною теорією мали б катастрофічно перенавчатися.

Та цього не відбувається через те, що дослідники називають феноменом подвійного спуску: коли розмір моделі зростає за поріг інтерполяції, похибка на тесті знову зменшується. Свою роль відіграють і неявний зсув SGD у бік пласких мінімумів, і структурованість даних.

Практичний підсумок: якщо ваші дані достатньо великі й різноманітні, більші моделі часто узагальнюють краще, а не гірше. Це суперечить інтуїції, але нині добре підтверджено емпірично.

Вибір правильного методу

🧠 Відкрити нейронну мережу →