Тембр: колір звуку

3D Simulations

🎵 Акустика · Музична акустика

📅 Березень 2026⏱ 11 хв🟡 Середній · Останнє оновлення: 28 травня 2026 р.

Тембр: колір звуку

Скрипка і флейта, що грають ту саму ноту A4 (440 Hz), звучать цілком по-різному — та сама висота, та сама гучність, проте їх миттєво розрізняєш. Ця якість і є тембр: усе у звуці, окрім його висоти, гучності та тривалості. Розуміти тембр означає розуміти аналіз Фур'є, резонансні порожнини, часові обвідні та те, як слухова система зіставляє спектральну структуру із сприйнятою ідентичністю.

Автор: Команда MySimulator · Редакційна перевірка: Редакція MySimulator

1. Гармонічний ряд та обертони

Натягнута струна довжини L, закріплена з обох кінців, підтримує стоячі хвилі лише на певних довжинах хвиль. Дозволені частоти є цілими кратними основної:

Гармоніки натягнутої струни або повітряного стовпа (відкрита труба): f_n = n \cdot f₀ для n = 1, 2, 3, 4, ... f₀ = основна частота (перша гармоніка) f₁ = f₀ \leftarrow основна f₂ = 2f₀ \leftarrow октава вище f₃ = 3f₀ \leftarrow чиста квінта над октавою f₄ = 4f₀ \leftarrow дві октави вище f₅ = 5f₀ \leftarrow велика терція над цим Швидкість хвилі в струні: v = \sqrt(T/μ) T = натяг, μ = маса на одиницю довжини Основна: f₀ = v/2L = (1/2L) \cdot \sqrt(T/μ) (струна довжини L) Закрита труба (на кшталт кларнета, закрита з одного кінця): f_n = n \cdot f₀, але лише НЕПАРНІ гармоніки: n = 1, 3, 5, 7, ... \to характерний «порожнистий» звук; на дуодециму вище за октаву (дуодецима, а не октава) Негармонічність (фортепіано, дзвони): Реальні струни мають жорсткість \to моди відхиляються від точних цілих відношень. f_n \neq n\cdotf₀, а f_n = n\cdotf₀ \cdot \sqrt(1 + B\cdotn²) де B = коефіцієнт жорсткості. Фортепіано B \approx 10⁻⁴ до 10⁻³ (більше для коротких товстих басових струн). Незначна негармонічність додає «насиченості» фортепіанному тону.

2. Фур'є-розклад звуків інструментів

Будь-яку періодичну форму хвилі можна розкласти в суму синусоїд на гармонічно пов'язаних частотах — теорема Фур'є. Для періодичного звуку з періодом T = 1/f₀:

Ряд Фур'є періодичної форми хвилі x(t): x(t) = A₀/2 + Σ_{n=1}^{∞} [Aₙ cos(2πnf₀t) + Bₙ sin(2πnf₀t)] = Σ_{n=0}^{∞} Cₙ cos(2πnf₀t + φₙ) Cₙ = амплітуда n-ї гармоніки (спектральна амплітуда) φₙ = фаза n-ї гармоніки (спектральна фаза) Спектр потужності: |Cₙ|² від n — «відбиток пальця» тембру. Характерні гармонічні спектри: Чиста синусоїда: лише C₁ → одинична лінія спектра → флейта (приблизно) Прямокутна хвиля: a(t) = ±1 рівної тривалості C_n = 4/(nπ) лише для непарних n → непарні гармоніки зі спадом амплітуди 1/n Жорсткий, дзижчливий звук (нагадує порожнисту, язичкову якість кларнета) Пилоподібна хвиля: a(t) = 2(t/T − ⌊t/T⌋) − 1 C_n = 2/(nπ) для ВСІХ n → усі гармоніки зі спадом амплітуди 1/n Насичений, різкий звук (нагадує скрипку, смичкову струну) Трикутна хвиля: C_n = 8/(n²π²) для непарних n → непарні гармоніки зі спадом 1/n² М'якший, більш синусоїдальний характер (нагадує флейту) Скрипка (смичкова струна): багата на гармоніки до ~5kHz, спектральна обвідна формується резонансами корпусу: повітряна порожнина Гельмгольца ~275 Hz, корпус ~440 Hz та резонанси дек 1-2 kHz. ~10-15 значущих гармонік на кожній висоті. Труба: фактично ВСІ гармоніки виражені аж до дуже високих частот. Основна часто слабка; домінують 2-а – 8-а гармоніки. Чашка мундштука + розтруб створюють характерну спектральну обвідну.

3. ADSR-обвідні та часовий характер

Тембр не є статичним. Те, як звук починається, триває та закінчується — його часова обвідна — настільки ж важливе для впізнавання, як і його усталений спектр. Приберіть атаку фортепіанної ноти: слухачі помилково сприймуть її як орган. Стандартна модель ADSR ділить еволюцію амплітуди на чотири стадії:

ADSR-обвідна: A(t) = Attack (атака): 0 \to пікова амплітуда за час T_A (лінійне або експоненційне наростання) Decay (спад): пік \to рівень підтримання за час T_D (експоненційний спад) Sustain (підтримання): тримає рівень S, поки клавішу натиснуто [не час, а рівень] Release (затухання): S \to 0 за час T_R після відпускання клавіші (експоненційний спад) Типові значення (ілюстративно): Інструмент T_A T_D S T_R Фортепіано 1-10ms 100-300ms ~0 300-1000ms (ударний, без підтримання) Орган 1-5ms 0ms 1.0 50-100ms (миттєвий вихід на підтримання) Скрипка смич. 50-200ms 0ms 1.0 100-300ms (повільна атака смичка) Барабан <5ms швидкий 0 коротке (суто ударний) Перехідні процеси атаки — найкритичніша часова ділянка для впізнавання: Перші ~50-200 мс ноти містять спектральну структуру, що швидко змінюється, поки резонатори заповнюються. Ці негармонічні, шумні перехідні процеси дають: • «прикус» язичка кларнета • «дряпання» смичка скрипки • клацання молоточка фортепіано Експеримент: видалення 50-мс атаки з фортепіанної ноти в середньому спричиняє помилкове впізнавання як інших інструментів у ~60% випадків.

4. Частоти формант і вокальний тембр

Голосовий тракт людини — це акустичний резонатор, форма якого (керована язиком, щелепою, губами та піднебінною завісою) обирає, які обертони джерела голосу підсилюються. Ці резонансні піки називаються формантами:

5. Спектральний центроїд, яскравість і сприйняття

Шорсткість і биття: коли дві частотні компоненти різняться на 20–250 Hz (у межах однієї критичної смуги), їхня взаємодія породжує биття на різницевій частоті. Биття в діапазоні 20–200 Hz створює відчуття шорсткості — сприймається як різке або дисонантне. Інструменти з густими, нерозділеними частковими тонами (наприклад, смичкова тарілка) звучать шорстко; ті, що мають добре рознесені гармоніки, звучать гладко. Шорсткість відрізняється від дисонансу (когнітивного явища, заснованого на музичних очікуваннях).

6. Порівняння інструментів: спектральні підписи

Різні інструменти створюють помітно різні спектральні форми навіть за тієї самої висоти та гучності:

Флейта: переважно основна з сильною 2-ю гармонікою; вищі гармоніки швидко спадають. Низький спектральний центроїд як для духового інструмента. Багата лише в атаці (спочатку шумний струменевий звук на амбушюрі). Переважно синусоїдоподібна в усталеному стані.
Кларнет: сильні непарні гармоніки (1-а, 3-я, 5-а) через циліндричний канал, закритий з одного кінця. Характерна порожниста, язичкова якість. Змінює характер між регістрами (регістровий клапан стрибає на дуодециму, а не на октаву). Дуже різний спектральний профіль між регістрами шалюмо й кларіно.
Гобой: джерело з подвійним язичком дає надзвичайно багатий гармонічний вміст (усі гармоніки сильні). Дуже високий спектральний центроїд. Носова, пронизлива якість: потужні 3-я – 8-а гармоніки. Резонанси корпусу створюють характерні формантоподібні піки на ~300 Hz та ~1200 Hz.
Скрипка (смичкова): багатий гармонічний спектр, що формується резонансами верхньої та нижньої дек корпусу. Сильне зв'язування через басову планку та душку. Вовчий тон: певні висоти збігаються з резонансом корпусу, створюючи небажану осциляцію зворотного зв'язку. Вібрато створює частотну модуляцію ±30–60 центів на 5–7 Hz, розподіляючи енергію та створюючи характерне мерехтіння.
Труба: дуже сильні високі часткові тони, часто аж до 10 kHz. Частота зрізу розтруба: хвилі нижче за ~750 Hz відбиваються всередину (самопідсилення), вище — виходять назовні (випромінювання). Сурдина різко змінює спектральну обвідну: пряма сурдина поглинає високі частоти; «вау-вау» динамічно зсуває піки формант.
Фортепіано: кожну струну б'є фетровий молоточок; час контакту визначає, які гармоніки збуджуються. Короткий час контакту (сильніший удар, forte): усі гармоніки до високих частот. Довгий час контакту (тихо, pianissimo): високі гармоніки ослаблені. Також: унісонне хорове налаштування (фортепіано має 2-3 струни на ноту, розладнані на 1-3 центи) створює характерне «биття» та подовжений спад.

7. Синтез тембру: адитивний, субтрактивний і FM

АДИТИВНИЙ СИНТЕЗ: Будуйте складні форми хвиль, підсумовуючи осцилятори (кожен на гармонічній частоті). Повний контроль над амплітудою та фазою кожного часткового тону. x(t) = Σ_{n=1}^{N} Aₙ(t) · sin(2π·n·f₀·t + φₙ) Кожен Aₙ(t) може мати власну ADSR-обвідну → реалістична еволюція інструмента. Проблема: обчислювально дорого для N = 50+ часткових тонів. Використано: орган Хаммонда (тонколесо = адитивний принцип), SONAR, рендеринг аудіо в Pixar. СУБТРАКТИВНИЙ СИНТЕЗ: Починайте зі спектрально багатого джерела (пилоподібна хвиля, шум) Застосовуйте смугові або низькочастотні фільтри для формування спектра. Класичний ланцюг: VCO (осцилятор) → VCF (фільтр) → VCA (підсилювач) ↑ висота ↑ тембр ↑ обвідна Фільтр: резонансний фільтр нижніх частот (драбинний фільтр Moog: 4 каскадні RC-ланки → 24 dB/окт) f_cutoff: керує яскравістю Q / резонанс: зворотний зв'язок на частоті зрізу → різкий пік, аж до самозбудження Модульні синтезатори (Buchla, Moog) по суті всі мають субтрактивну архітектуру. ЧАСТОТНО-МОДУЛЬОВАНИЙ (FM) СИНТЕЗ: Чаунінг (1973), комерціалізовано: Yamaha DX7 (1983) — продано 300 000+ одиниць. Сигнал-модулятор модулює частоту несучої: x(t) = A · sin(2π·f_c·t + I·sin(2π·f_m·t)) f_c = частота несучої (сприйнята висота) f_m = частота модулятора I = індекс модуляції = Δf/f_m (керує «яскравістю» та гармонічним вмістом) Результуючий спектр: функції Бесселя першого роду Бічні смуги на f_c ± n·f_m для n = 0, 1, 2, 3, ... Амплітуда n-ї бічної смуги: A·|J_n(I)| За I = 0: чиста синусоїда (лише несуча) Зростання I → з'являються бічні смуги → дедалі насиченіші, негармонічніші тембри Коли f_c/f_m = ціле відношення: гармонічний спектр (музичні висотні звуки) Коли f_c/f_m ≠ ціле: негармонічний спектр (дзвін, металеві звуки) DX7: 6 операторів (осциляторів), упорядкованих у 32 «алгоритми» (конфігурації маршрутизації). Створює все — від електрофортепіано (Rhodes) до мідних, струнних, дзвонів. ХВИЛЬОВО-ТАБЛИЧНИЙ СИНТЕЗ (сучасний стандарт у програмних синтезаторах): Зберігайте один цикл форми хвилі цифрово. Зацикліть його. Морфуйте між хвильовими таблицями в реальному часі (перехід від атаки до спектра підтримання). Дозволяє довільні спектральні форми. Використано в: Xfer Serum, Native Instruments Massive X.

Психоакустична значущість: FM-синтез став комерційно домінантним не тому, що найточніше відтворював реальні інструменти, а тому, що створював перцептивно переконливі звуки, які активували ті самі слухові шляхи, що й справжні — використовуючи ділянки формант, структуру перехідних процесів атаки та гармонічну густину так, що вухо вважало це правдоподібним. Це ілюструє фундаментальний принцип: мета синтезу звуку — не фізична точність, а перцептивна правдоподібність.