Довідка та теорія
Наївний баєсів класифікатор обирає клас із найбільшою апостеріорною ймовірністю за ознаками точки, використовуючи правило Баєса та одне спрощувальне припущення.
Правило Баєса
P(c | x) ∝ P(c) · P(x | c). Апріорна
ймовірність класу P(c) — це частка навчальних точок
у класі c; правдоподібність
P(x | c) показує, наскільки точка пасує цьому класу.
«Наївне» припущення
Ознаки вважаються умовно незалежними за заданого класу,
тож спільна правдоподібність розкладається на множники:
P(x | c) = P(x₁ | c) · P(x₂ | c). Це рідко точно
справджується, та класифікатор швидкий і працює на диво добре.
Гаусова модель
Для неперервних ознак ми підганяємо гаусіану для кожного
класу за кожною віссю:
P(xⱼ | c) = 𝒩(xⱼ; μ_{cj}, σ²_{cj}). Тож кожен клас
має середнє та дисперсію за кожною віссю, оцінені з його точок.
Затінений еліпс позначає одне стандартне відхилення.
Межа рішення
Тло розфарбовує кожен піксель за класом із максимальною апостеріорною ймовірністю; що впевненіша модель, то насиченіший відтінок. Оскільки дисперсії класів різняться, межа квадратична, а не пряма лінія — це підпис гаусового наївного Баєса.