Тон Шепарда та слухові ілюзії — висота без кінця
Тон Шепарда — одна з найвражаючіших слухових ілюзій, які будь-коли були придумані: звук, що нібито вічно піднімається за висотою, так і не досягаючи вершини. Так само як зоровий мозок можна обманути сходами Ешера, слухову систему можна переконати, що висота нескінченно зростає чи спадає, тоді як насправді звук є періодичним і обмеженим. Цей дивовижний ефект має значення, бо він розкриває, як вухо й мозок конструюють відчуття, яке ми називаємо висотою звуку, — відокремлюючи абстрактне поняття «висоти тону» від буквальних частот, наявних у сигналі. Поза лабораторією ілюзія стала улюбленим інструментом кінокомпозиторів, звукорежисерів та електронних музикантів, які використовують її для створення невпинної напруги. У цій статті ми розглянемо, як будується тон Шепарда, яка математика стоїть за ним, де він трапляється у реальному світі та які поширені непорозуміння його оточують.
Як будується ілюзія
Тон Шепарда — це не одна частота, а стос чистих синусоїд, кожну з яких відокремлено від сусідньої рівно на одну октаву, тобто кожна наступна складова має вдвічі більшу частоту за ту, що під нею. Типовий варіант може поєднувати часткові на 110 Гц, 220 Гц, 440 Гц, 880 Гц і так далі. Ключовою складовою є амплітудна обвідна: замість того щоб відтворювати всі часткові з однаковою гучністю, кожну зважено фіксованою дзвоноподібною кривою, заданою над логарифмом частоти. Часткові поблизу центру чутного діапазону гучні, тоді як ті, що на крайньому нижньому й верхньому краях, згасають до тиші.
Частоту k-ї часткової можна записати як f_k = f_0 · 2^k, де f_0 — базова частота, а k пробігає набір цілих чисел. Амплітуда кожної часткової підпорядковується гаусовому зважуванню на осі логарифма частоти, що часто виражають як A(f) = exp( -((log2(f) - mu)^2) / (2 * sigma^2) ), де mu — центр обвідної, а sigma керує її шириною. Оскільки обвідна зафіксована на місці, а часткові сковзають крізь неї, жодна окрема складова ніколи не домінує надовго. Коли висхідна часткова дрейфує до гучного центру, інша на верхньому краї тихо зникає, а свіжа з'являється внизу. Результатом є самооновний спектр, чия сприйнята висота продовжує зростати, тоді як його загальний характер залишається сталим, — визначальний трюк цієї ілюзії.
Чому мозок обманюється
Щоб зрозуміти, чому ілюзія працює, корисно усвідомити, що сприйняття висоти звуку людиною не є одновимірним. Психоакустики описують висоту як таку, що має дві складові: висоту тону — загальне відчуття високого чи низького, та хрому — якість, що змушує всі ноти, названі, наприклад, «до», звучати спорідненими незалежно від октави. Тон Шепарда навмисно тримає хрому в русі, зберігаючи загальний спектральний центр ваги фіксованим. Вухо стежить за поступовим зсувом хроми та повідомляє «зростає», але не має фіксованого якоря, за яким могло б помітити, що абсолютна спектральна енергія незмінна. По суті, мозок надає перевагу локальній відносній зміні перед глобальним абсолютним положенням.
Це розділення можна уявити як спіраль: висота закручується вгору, наче гвинтові сходи, де висота представляє висоту тону, а кутове положення представляє хрому. Один оберт по спіралі повертає вас до тієї самої хроми на октаву вище. Тон Шепарда тримає вас у безперервному кружлянні по спіралі, так і не піднімаючи центральною віссю, тож слухова система сприймає вічне обертання як вічне сходження. Ілюзія використовує те, що октавно споріднені тони чуються як надзвичайно схожі; коли часткова зникає вгорі й знову з'являється внизу на октаву нижче, заміна безшовна, бо ці дві перцептивно майже ідентичні. Дослідження свідчать, що ефект надійний для багатьох слухачів, хоча, як показує споріднений парадокс тритону, сприйнятий напрям може ставати справді неоднозначним, коли спектральні підказки збалансовані. Сама ця неоднозначність є показовою: вона демонструє, що напрям висоти частково є висновком, який робить мозок, а не фактом, що зчитується безпосередньо з повітря.
Застосування у реальному світі
Тон Шепарда та його неперервний родич — глісандо Шепарда–Ріссе — вирвалися з психологічної лабораторії, щоб стати практичними творчими інструментами. Поширені застосування включають:
- Кіномузика: композитори використовують нескінченне зростання, щоб підтримувати жах та динаміку. Цей прийом славетно асоціюється з фільмами Крістофера Нолана, де він підкріплює відчуття невпинної, нерозв'язаної напруги.
- Аудіо відеоігор: дизайнери застосовують спадні чи висхідні тони Шепарда під час сцен погоні та головоломок з нескінченними сходами, щоб натякнути на безкінечний рух чи наростаючу небезпеку без очевидної точки повтору.
- Електронна та експериментальна музика: митці від ранньої електронної традиції й далі використовували глісандо Ріссе для створення гіпнотичних, дезорієнтуючих пасажів, які ніколи не здаються розв'язаними.
- Наука про слух та освіта: ілюзія є стандартною демонстрацією у психоакустиці, її використовують, щоб навчати, як висота тону й хрома обробляються окремо, та досліджувати індивідуальні відмінності у сприйнятті.
Поширені хибні уявлення
Часте непорозуміння полягає в тому, що тон Шепарда «насправді» постійно стає вищим, тобто його частоти зростають без обмежень. Це не так: спектр обмежений і за повний цикл повторюється, тож фізичний звук є періодичним. Інша помилка — припускати, що ефект залежить від трюку зі записом чи прихованого склеювання петлі; насправді він виникає суто з шаруватої октавної структури та фіксованої обвідної. Деякі слухачі також вважають, що всі сприймають однакове, однозначне зростання. Хоча базова ілюзія надійна, парадокс тритону показує, що сприйнятий напрям може різнитися між людьми. Нарешті, тон Шепарда іноді плутають із простим зсувом висоти, але звичайне транспонування справді переміщує частоти, тоді як ілюзія тримає чутний регістр сталим.
Часті запитання
Що таке тон Шепарда? Тон Шепарда — це звук, складений з кількох синусоїд, рознесених на октаву одна від одної, гучність яких формується фіксованою дзвоноподібною обвідною. Коли частоти складових зсуваються, тон нібито нескінченно зростає або спадає за висотою, проте насправді ніколи не виходить за межі фіксованого регістру.
Чому здається, що висота зростає вічно? Кожна октавна часткова тихо з'являється внизу спектра й затихає вгорі. Коли одна часткова зникає на верхньому краї, нова народжується внизу, тож мозок сприймає неперервний рух угору без жодної справжньої кінцевої точки.
Хто відкрив тон Шепарда? Ілюзію названо на честь Роджера Шепарда, американського когнітивного науковця, який описав її 1964 року. Неперервно сковзний варіант, який часто називають глісандо Шепарда–Ріссе, пізніше створив композитор Жан-Клод Ріссе.
Яка різниця між тоном Шепарда та глісандо Ріссе?
Початковий тон Шепарда рухався дискретними хроматичними кроками, створюючи ілюзію гами, що вічно зростає. Версія Ріссе використовує неперервне ковзання частоти, а не кроки, утворюючи плавне, безшовне зростання або спадання замість покрокового руху.
Чи використовують тон Шепарда у кіно й музиці?
Так. Ілюзію широко застосовують для нагнітання напруги у кіномузиці, зокрема у фільмах Крістофера Нолана, у саундтреках до відеоігор, а також електронні музиканти, які використовують її гіпнотичну, нерозв'язану якість.
Чи всі сприймають ілюзію однаково?
Ні. Сприйняття залежить від умов прослуховування, використаної спектральної обвідної та індивідуального слуху. Дослідження свідчать, що деякі слухачі чують напрям руху неоднозначно, особливо у спорідненому парадоксі тритону, де сприйнятий напрям залежить від слухача.
Що таке парадокс тритону?
Парадокс тритону, який досліджувала Даяна Дойч, використовує два звуки в стилі тону Шепарда на відстані тритону один від одного. Те, чи чують слухачі цю пару як висхідну чи спадну, різниться від людини до людини й, очевидно, пов'язане з мовою та регіональними особливостями мовлення.
Чи може тон Шепарда спадати, а не зростати?
Так. Зсуваючи часткові вниз, а не вгору, та сама конструкція утворює нескінченно спадну висоту, яку іноді називають спадним тоном Шепарда або спадним глісандо Шепарда–Ріссе.
Як тон Шепарда генерується цифровим способом?
Комп'ютер сумує кілька синусоїдальних осциляторів, рознесених на одну октаву, а потім множить кожен на амплітуду, взяту з фіксованої гаусової обвідної на логарифмічній осі частот. Повільне розгортання базової частоти за збереження фіксованої обвідної дає ілюзію.
Чому тон Шепарда називають слуховою ілюзією?
Це ілюзія, бо сприйнята ознака — висота, що постійно змінюється, — не відповідає фізичному сигналу, який є періодичним і обмеженим. Інтерпретація мозком висоти звуку розходиться з фактичним спектральним вмістом, подібно до того, як зорові ілюзії ошукують око.
Спробуйте самі
Найкращий спосіб осягнути ілюзію — почути її та водночас спостерігати за спектром. Дослідіть ці інтерактивні симуляції:
- shepard-tone — згенеруйте нескінченно висхідну й спадну висоту та налаштуйте обвідну.
- spectral-music — поекспериментуйте з накладанням часткових та формуванням спектрів.
- voice-synthesis — дослідіть, як вухо вибудовує сприйняту висоту зі складних звуків.
Висновок
Тон Шепарда — це значно більше, ніж акустична дивовижа. Накладаючи октавно рознесені часткові під фіксованою дзвоноподібною обвідною, він утворює висоту, що нібито вічно піднімається чи спадає, тоді як фізичний звук залишається міцно на місці. Роблячи це, він оголює архітектуру людського слуху — те, як мозок відокремлює висоту тону від хроми та виводить рух із відносної зміни. Чи то посилюючи напругу в кінотеатрі, чи навчаючи студентів, як сприйняття може розходитися з реальністю, ілюзія залишається прекрасною демонстрацією того, що почуте нами завжди є інтерпретацією, а ніколи простим зчитуванням повітря довкола нас.