📅 Березень 2026⏱ 11 хв🟡 Середній·Останнє оновлення: 28 травня 2026 р.
Тембр: колір звуку
Скрипка і флейта, що грають ту саму ноту A4 (440 Hz), звучать цілком по-різному — та сама висота, та сама гучність, проте їх миттєво розрізняєш. Ця якість і є тембр: усе у звуці, окрім його висоти, гучності та тривалості. Розуміти тембр означає розуміти аналіз Фур'є, резонансні порожнини, часові обвідні та те, як слухова система зіставляє спектральну структуру із сприйнятою ідентичністю.
Натягнута струна довжини L, закріплена з обох кінців, підтримує стоячі хвилі лише на певних довжинах хвиль. Дозволені частоти є цілими кратними основної:
Гармоніки натягнутої струни або повітряного стовпа (відкрита труба):
f_n = n · f₀ для n = 1, 2, 3, 4, ...
f₀ = основна частота (перша гармоніка)
f₁ = f₀ ← основна
f₂ = 2f₀ ← октава вище
f₃ = 3f₀ ← чиста квінта над октавою
f₄ = 4f₀ ← дві октави вище
f₅ = 5f₀ ← велика терція над цим
Швидкість хвилі в струні: v = √(T/μ) T = натяг, μ = маса на одиницю довжини
Основна: f₀ = v/2L = (1/2L) · √(T/μ) (струна довжини L)
Закрита труба (на кшталт кларнета, закрита з одного кінця):
f_n = n · f₀, але лише НЕПАРНІ гармоніки: n = 1, 3, 5, 7, ...
→ характерний «порожнистий» звук; на дуодециму вище за октаву (дуодецима, а не октава)
Негармонічність (фортепіано, дзвони):
Реальні струни мають жорсткість → моди відхиляються від точних цілих відношень.
f_n ≠ n·f₀, а f_n = n·f₀ · √(1 + B·n²) де B = коефіцієнт жорсткості.
Фортепіано B ≈ 10⁻⁴ до 10⁻³ (більше для коротких товстих басових струн).
Незначна негармонічність додає «насиченості» фортепіанному тону.
2. Фур'є-розклад звуків інструментів
Будь-яку періодичну форму хвилі можна розкласти в суму синусоїд на гармонічно пов'язаних частотах — теорема Фур'є. Для періодичного звуку з періодом T = 1/f₀:
Ряд Фур'є періодичної форми хвилі x(t):
x(t) = A₀/2 + Σ_{n=1}^{∞} [Aₙ cos(2πnf₀t) + Bₙ sin(2πnf₀t)]
= Σ_{n=0}^{∞} Cₙ cos(2πnf₀t + φₙ)
Cₙ = амплітуда n-ї гармоніки (спектральна амплітуда)
φₙ = фаза n-ї гармоніки (спектральна фаза)
Спектр потужності: |Cₙ|² від n — «відбиток пальця» тембру.
Характерні гармонічні спектри:
Чиста синусоїда:
лише C₁ → одинична лінія спектра → флейта (приблизно)
Прямокутна хвиля: a(t) = ±1 рівної тривалості
C_n = 4/(nπ) лише для непарних n → непарні гармоніки зі спадом амплітуди 1/n
Жорсткий, дзижчливий звук (нагадує порожнисту, язичкову якість кларнета)
Пилоподібна хвиля: a(t) = 2(t/T − ⌊t/T⌋) − 1
C_n = 2/(nπ) для ВСІХ n → усі гармоніки зі спадом амплітуди 1/n
Насичений, різкий звук (нагадує скрипку, смичкову струну)
Трикутна хвиля:
C_n = 8/(n²π²) для непарних n → непарні гармоніки зі спадом 1/n²
М'якший, більш синусоїдальний характер (нагадує флейту)
Скрипка (смичкова струна): багата на гармоніки до ~5kHz, спектральна обвідна
формується резонансами корпусу: повітряна порожнина Гельмгольца ~275 Hz,
корпус ~440 Hz та резонанси дек 1-2 kHz.
~10-15 значущих гармонік на кожній висоті.
Труба: фактично ВСІ гармоніки виражені аж до дуже високих частот.
Основна часто слабка; домінують 2-а – 8-а гармоніки.
Чашка мундштука + розтруб створюють характерну спектральну обвідну.
3. ADSR-обвідні та часовий характер
Тембр не є статичним. Те, як звук починається, триває та закінчується — його часова обвідна — настільки ж важливе для впізнавання, як і його усталений спектр. Приберіть атаку фортепіанної ноти: слухачі помилково сприймуть її як орган. Стандартна модель ADSR ділить еволюцію амплітуди на чотири стадії:
ADSR-обвідна:
A(t) =
Attack (атака): 0 → пікова амплітуда за час T_A (лінійне або експоненційне наростання)
Decay (спад): пік → рівень підтримання за час T_D (експоненційний спад)
Sustain (підтримання): тримає рівень S, поки клавішу натиснуто [не час, а рівень]
Release (затухання): S → 0 за час T_R після відпускання клавіші (експоненційний спад)
Типові значення (ілюстративно):
Інструмент T_A T_D S T_R
Фортепіано 1-10ms 100-300ms ~0 300-1000ms (ударний, без підтримання)
Орган 1-5ms 0ms 1.0 50-100ms (миттєвий вихід на підтримання)
Скрипка смич. 50-200ms 0ms 1.0 100-300ms (повільна атака смичка)
Барабан <5ms швидкий 0 коротке (суто ударний)
Перехідні процеси атаки — найкритичніша часова ділянка для впізнавання:
Перші ~50-200 мс ноти містять спектральну структуру, що швидко
змінюється, поки резонатори заповнюються. Ці негармонічні, шумні перехідні процеси дають:
• «прикус» язичка кларнета
• «дряпання» смичка скрипки
• клацання молоточка фортепіано
Експеримент: видалення 50-мс атаки з фортепіанної ноти в середньому
спричиняє помилкове впізнавання як інших інструментів у ~60% випадків.
4. Частоти формант і вокальний тембр
Голосовий тракт людини — це акустичний резонатор, форма якого (керована язиком, щелепою, губами та піднебінною завісою) обирає, які обертони джерела голосу підсилюються. Ці резонансні піки називаються формантами:
Модель «джерело-фільтр» мовлення (Фант 1960):
S(f) = G(f) · V(f)
G(f) = спектр джерела (коливання голосових складок)
= гармоніки f₀ (основної) зі спадом −12 dB/октаву
V(f) = передавальна функція голосового тракту (фільтр)
= набір резонансних піків на частотах формант F1, F2, F3, ...
Частоти формант залежать від довжини голосового тракту L (~17 см у дорослого чоловіка):
Fn ≈ (2n−1)c / 4L для рівномірної труби (спрощено)
F1 ≈ 300-900 Hz (висота щелепи / розкриття рота — перший резонанс)
F2 ≈ 600-2500 Hz (передньо-заднє положення язика)
F3 ≈ 2000-3500 Hz (кінчик язика, вторинні звуження)
Форманти голосних (приблизно, дорослий чоловік):
Голосна F1 (Hz) F2 (Hz)
/i/ 270 2290 (високий передній: «і» як в «місто»)
/æ/ 660 1720 (відкритий передній: англ. «ah» в «cat»)
/ɑ/ 730 1090 (відкритий задній: «а» як в «батько»)
/u/ 300 870 (високий задній: «у» як в «суп»)
/ε/ 530 1840 (середній передній: «е» як в «день»)
Співоча форманта (~2500-3500 Hz):
Треновані класичні співаки групують резонанси F3, F4, F5 на 2-3 kHz.
Ця ділянка має значно менше енергії в спектрах оркестру → співак «пробивається»
без гучнішого звукоутворення. Характерне для тренованих оперних голосів.
Відсутнє у хорових співаків (вони співають з оркестром, а не проти нього).
5. Спектральний центроїд, яскравість і сприйняття
Спектральний центроїд: «центр мас» спектра звуку.
Корелює зі сприйнятою яскравістю / різкістю тембру.
SC = Σ(fₙ · |Xₙ|) / Σ|Xₙ|
де fₙ = частота n-ї спектральної компоненти
|Xₙ| = амплітуда n-ї компоненти
Високий SC (наприклад, 1000-3000 Hz): яскравий, різкий, металевий → труба, гобой, скрипка
Низький SC (наприклад, 200-500 Hz): темний, теплий, м'який → контрабас, туба, кларнет (низький регістр)
Інші перцептивно значущі спектральні ознаки:
Спектральна пласкість (тональна проти шумоподібної):
SF = середнє_геометричне(|X|) / середнє_арифметичне(|X|)
SF = 1: чистий білий шум; SF → 0: одинична синусоїдальна нота
Підсвідомо керує сприйняттям «шорсткості» проти чистоти
Спектральний розкид:
Дисперсія спектра навколо центроїда.
Високий розкид: насиченіший, менш сфокусований тон.
Відношення непарних/парних гармонік:
Інструменти із сильними непарними гармоніками:
кларнети (закрита труба → дуже порожнистий характер)
Інструменти із сильними парними + непарними гармоніками:
скрипка, труба → «повніший» звук
Дослідження багатовимірного шкалювання (MDS) Грея (1977):
16 тонів інструментів вирівняно за висотою/гучністю. Слухачі оцінювали схожість.
MDS виявило 3 перцептивні виміри:
1. Розподіл спектральної енергії (центроїд / яскравість)
2. Спектральний потік (як швидко спектр змінюється з часом — характер атаки)
3. Синхронність перехідних процесів атаки (чи гармоніки починаються одночасно)
Шорсткість і биття: коли дві частотні компоненти різняться на 20–250 Hz (у межах однієї критичної смуги), їхня взаємодія породжує биття на різницевій частоті. Биття в діапазоні 20–200 Hz створює відчуття шорсткості — сприймається як різке або дисонантне. Інструменти з густими, нерозділеними частковими тонами (наприклад, смичкова тарілка) звучать шорстко; ті, що мають добре рознесені гармоніки, звучать гладко. Шорсткість відрізняється від дисонансу (когнітивного явища, заснованого на музичних очікуваннях).
6. Порівняння інструментів: спектральні підписи
Різні інструменти створюють помітно різні спектральні форми навіть за тієї самої висоти та гучності:
Флейта: переважно основна з сильною 2-ю гармонікою; вищі гармоніки швидко спадають. Низький спектральний центроїд як для духового інструмента. Багата лише в атаці (спочатку шумний струменевий звук на амбушюрі). Переважно синусоїдоподібна в усталеному стані.
Кларнет: сильні непарні гармоніки (1-а, 3-я, 5-а) через циліндричний канал, закритий з одного кінця. Характерна порожниста, язичкова якість. Змінює характер між регістрами (регістровий клапан стрибає на дуодециму, а не на октаву). Дуже різний спектральний профіль між регістрами шалюмо й кларіно.
Гобой: джерело з подвійним язичком дає надзвичайно багатий гармонічний вміст (усі гармоніки сильні). Дуже високий спектральний центроїд. Носова, пронизлива якість: потужні 3-я – 8-а гармоніки. Резонанси корпусу створюють характерні формантоподібні піки на ~300 Hz та ~1200 Hz.
Скрипка (смичкова): багатий гармонічний спектр, що формується резонансами верхньої та нижньої дек корпусу. Сильне зв'язування через басову планку та душку. Вовчий тон: певні висоти збігаються з резонансом корпусу, створюючи небажану осциляцію зворотного зв'язку. Вібрато створює частотну модуляцію ±30–60 центів на 5–7 Hz, розподіляючи енергію та створюючи характерне мерехтіння.
Труба: дуже сильні високі часткові тони, часто аж до 10 kHz. Частота зрізу розтруба: хвилі нижче за ~750 Hz відбиваються всередину (самопідсилення), вище — виходять назовні (випромінювання). Сурдина різко змінює спектральну обвідну: пряма сурдина поглинає високі частоти; «вау-вау» динамічно зсуває піки формант.
Фортепіано: кожну струну б'є фетровий молоточок; час контакту визначає, які гармоніки збуджуються. Короткий час контакту (сильніший удар, forte): усі гармоніки до високих частот. Довгий час контакту (тихо, pianissimo): високі гармоніки ослаблені. Також: унісонне хорове налаштування (фортепіано має 2-3 струни на ноту, розладнані на 1-3 центи) створює характерне «биття» та подовжений спад.
7. Синтез тембру: адитивний, субтрактивний і FM
АДИТИВНИЙ СИНТЕЗ:
Будуйте складні форми хвиль, підсумовуючи осцилятори (кожен на гармонічній частоті).
Повний контроль над амплітудою та фазою кожного часткового тону.
x(t) = Σ_{n=1}^{N} Aₙ(t) · sin(2π·n·f₀·t + φₙ)
Кожен Aₙ(t) може мати власну ADSR-обвідну → реалістична еволюція інструмента.
Проблема: обчислювально дорого для N = 50+ часткових тонів.
Використано: орган Хаммонда (тонколесо = адитивний принцип), SONAR, рендеринг аудіо в Pixar.
СУБТРАКТИВНИЙ СИНТЕЗ:
Починайте зі спектрально багатого джерела (пилоподібна хвиля, шум)
Застосовуйте смугові або низькочастотні фільтри для формування спектра.
Класичний ланцюг:
VCO (осцилятор) → VCF (фільтр) → VCA (підсилювач)
↑ висота ↑ тембр ↑ обвідна
Фільтр: резонансний фільтр нижніх частот (драбинний фільтр Moog: 4 каскадні RC-ланки → 24 dB/окт)
f_cutoff: керує яскравістю
Q / резонанс: зворотний зв'язок на частоті зрізу → різкий пік, аж до самозбудження
Модульні синтезатори (Buchla, Moog) по суті всі мають субтрактивну архітектуру.
ЧАСТОТНО-МОДУЛЬОВАНИЙ (FM) СИНТЕЗ:
Чаунінг (1973), комерціалізовано: Yamaha DX7 (1983) — продано 300 000+ одиниць.
Сигнал-модулятор модулює частоту несучої:
x(t) = A · sin(2π·f_c·t + I·sin(2π·f_m·t))
f_c = частота несучої (сприйнята висота)
f_m = частота модулятора
I = індекс модуляції = Δf/f_m (керує «яскравістю» та гармонічним вмістом)
Результуючий спектр: функції Бесселя першого роду
Бічні смуги на f_c ± n·f_m для n = 0, 1, 2, 3, ...
Амплітуда n-ї бічної смуги: A·|J_n(I)|
За I = 0: чиста синусоїда (лише несуча)
Зростання I → з'являються бічні смуги → дедалі насиченіші, негармонічніші тембри
Коли f_c/f_m = ціле відношення: гармонічний спектр (музичні висотні звуки)
Коли f_c/f_m ≠ ціле: негармонічний спектр (дзвін, металеві звуки)
DX7: 6 операторів (осциляторів), упорядкованих у 32 «алгоритми» (конфігурації маршрутизації).
Створює все — від електрофортепіано (Rhodes) до мідних, струнних, дзвонів.
ХВИЛЬОВО-ТАБЛИЧНИЙ СИНТЕЗ (сучасний стандарт у програмних синтезаторах):
Зберігайте один цикл форми хвилі цифрово. Зацикліть його.
Морфуйте між хвильовими таблицями в реальному часі (перехід від атаки до спектра підтримання).
Дозволяє довільні спектральні форми. Використано в: Xfer Serum, Native Instruments Massive X.
Психоакустична значущість: FM-синтез став комерційно домінантним не тому, що найточніше відтворював реальні інструменти, а тому, що створював перцептивно переконливі звуки, які активували ті самі слухові шляхи, що й справжні — використовуючи ділянки формант, структуру перехідних процесів атаки та гармонічну густину так, що вухо вважало це правдоподібним. Це ілюструє фундаментальний принцип: мета синтезу звуку — не фізична точність, а перцептивна правдоподібність.