🎵 Акустика · Когнітивна наука
📅 Березень 2026⏱ 11 хв🟡 Середній · Останнє оновлення: 28 травня 2026 р.

Психоакустика: як ми чуємо звук

Коливання частотою 440 Гц проходить крізь повітря, потрапляє у слуховий прохід, змушує вібрувати барабанну перетинку, рухає три крихітні кісточки, зміщує рідину у згорнутій спіраллю трубці, згинає 15 000 волоскових клітин і запускає нейронний код, який ваш мозок інтерпретує як «ноту Ля». Психоакустика — це наука, що пов'язує цей фізичний процес із суб'єктивним сприйняттям, і її висновки лежать в основі всього: від стиснення MP3 до проєктування концертних залів.

1. Вухо як аналізатор спектра

Завитка (cochlea) виконує біологічний аналіз частот, подібний до перетворення Фур'є. Її базилярна мембрана — це звужувана структура: широка та гнучка на вершині (реагує на низькі частоти), вузька й жорстка біля основи (реагує на високі частоти):

Тонотопічна карта (характеристичні частоти вздовж базилярної мембрани): Основа (basal): ~20,000 Hz Середина: ~1,000 Hz Вершина: ~20 Hz Приблизно: логарифмічний розподіл — кожна октава займає однакову довжину мембрани (~3.5 mm) Уся мембрана: ~35 mm → ~10 октав → ~3.5 mm на октаву Внутрішні волоскові клітини (IHC): первинні слухові рецептори (~3,500 на завитку) Відхилення стереоцилій → відкриває канали K⁺ та Ca²⁺ (кінчикові зв'язки) → рецепторний потенціал → вивільнення глутамату → збудження нейронів спірального ганглія Кожна IHC контактує з ~10-15 аферентними волокнами → високоточне кодування Зовнішні волоскові клітини (OHC): клітини-підсилювачі (~12,000 на завитку) Білок престин у латеральній стінці → електрорухливість (до 70,000 MHz!) Активний процес → підсилює рух базилярної мембрани на ~40 dB (100×) Першими гинуть при шумовій втраті слуху → чутливість + частотна роздільна здатність знижуються одночасно

2. Сприйняття гучності

Рівень звукового тиску (dB SPL): L_p = 20 · log₁₀(p / p_ref) де p_ref = 20 μPa (поріг чутності на 1 kHz) Ключові рівні: 0 dB SPL: поріг чутності на 1 kHz 20 dB SPL: шепіт 60 dB SPL: звичайна розмова 85 dB SPL: пошкодження слуху при тривалому впливі (NIHL) 120 dB SPL: поріг болю 194 dB SPL: теоретичний максимум у повітрі (надлишковий тиск = атмосферний тиск) Криві рівної гучності Флетчера–Мансона (1933), стандартизовані як ISO 226: На 1 kHz: рівень гучності (фон) = dB SPL за визначенням. На інших частотах: потрібно більше dB для досягнення такої ж відчутної гучності. На 1 kHz (поріг): 0 dB SPL = 0 фон На 100 Hz (поріг): потрібно ~40 dB SPL, щоб досягти порога → Ми набагато менш чутливі до низьких частот за малої гучності. Практичний наслідок: підсилення басів за тихого прослуховування (кнопка «loudness» на підсилювачах) компенсує знижену чутливість до низьких частот. Шкала сон (величина відчутної гучності): 1 сон = гучність тону 1 kHz при 40 dB SPL Подвоєння гучності (фон +10): кількість сон подвоюється Приблизно: S = 2^((P-40)/10) де P = гучність у фонах

3. Сприйняття висоти тону

Висота тону — це перцептивний відповідник основної частоти, проте цей зв'язок не такий простий:

Шкала мел (сприйняття висоти тону компресивне й нелінійне): Мели приблизно відповідають рівним відчутним інтервалам висоти тону. m = 2595 · log₁₀(1 + f/700) Висота тону зростає логарифмічно з частотою (кожна октава фортепіано = 2× частота). JND (ледь помітна різниця) у частоті: На 1 kHz: Δf ≈ 3 Hz (0.3%) На 8 kHz: Δf ≈ 40 Hz (0.5%) Досвідчені музиканти: ~1–2 центи (1 цент = 1/100 півтону ≈ 0.06% на 1 kHz)

4. Критичні смуги та маскування

Критична смуга (CBW): Діапазон частот, у межах якого діють маскування та певні ефекти перцептивного групування. Пов'язана з інтегрувальною смугою фільтра базилярної мембрани. Шкала барк (Цвікер, 1961): 24 критичні смуги в чутному діапазоні. Кожна критична смуга охоплює: ~100 Hz на низьких частотах (нижче 500 Hz) ~20% центральної частоти на вищих частотах Формула барк: z(f) = 13·arctan(0.76f/kHz) + 3.5·arctan((f/7.5kHz)²) Одночасне маскування: Маскувальний тон частотою f_m маскує (робить нечутними) сусідні тони. Маскування найефективніше для тонів У МЕЖАХ однієї критичної смуги. «Висхідне поширення маскування»: тони нижчих частот маскують вищі легше, ніж навпаки (асиметричне поширення). Часове маскування: Премаскування: маскер подається ПІСЛЯ цілі, але все одно маскує її (ретроактивне) Тривалість: ~20 ms (обробка мозком, спрямована назад у часі) Постмаскування (пряме): після замовкання маскера залишкове маскування триває ~100-200 ms Застосування — психоакустичне стиснення MP3 / AAC: Перцептивна модель виявляє тони/шум нижче порога маскування. Вони нижчі за поріг чутності → їх можна кодувати меншою кількістю бітів. Типовий MP3 128 kbps досягає коефіцієнта стиснення ~1:11 з мінімальною помітною втратою якості (усуває психоакустично нечутний вміст)

5. Бінауральний слух і локалізація

Два вуха забезпечують кілька акустичних ознак для локалізації звуку у трьох вимірах:

«Конус невизначеності»: Точки, рівновіддалені на уявному конусі навколо міжвушної осі, дають однакові ITD та ILD — це «конус невизначеності». Спектральні ознаки вушної раковини усувають цю неоднозначність. Без функціонуючої вушної раковини (або із заткнутими вухами) плутанина спереду/ззаду та похибки у висоті джерела різко зростають. Саме тому внутрішньовушні та накладні навушники відрізняються за якістю просторового звуку.

6. Ефект вечірки з коктейлями

На галасливій вечірці з безліччю розмов ви можете зосередитися на одному мовцеві й стежити за ним, відфільтровуючи інших, — навіть коли акустика не виокремлює жодного голосу окремо. Ця дивовижна здатність задіює кілька перцептивних механізмів:

7. Слухові ілюзії