Будь-який сигнал — уривок музики, знімок МРТ, радіохвиля — можна представити як суму простих синусоїд різної частоти. Аналіз Фур'є робить це розкладання точним, а швидке перетворення Фур'є робить його обчислювально здійсненним, уможливлюючи все — від стиснення MP3 до зв'язку 5G.
Сигнал — це просто величина, що змінюється з часом (або простором). Аудіохвиля записує тиск повітря в часі; електрокардіограма фіксує електричний потенціал серця; фотографія зберігає інтенсивність світла на двовимірній сітці. Ці сигнали виглядають складними у своєму природному представленні — часовій області — але часто мають набагато простішу структуру, якщо подивитися на них під іншим кутом.
Ключове прозріння Жозефа Фур'є, сформульоване в його трактаті 1822 року про теплопровідність, полягало в тому, що будь-яку періодичну функцію можна записати як нескінченну суму синусів і косинусів, частоти яких є цілими кратними (гармоніками) фундаментальної частоти. Цей принцип суперпозиції — не просто математична цікавинка: він відображає той факт, що синусоїдальні коливання є природними модами вібрації струн, мембран, електричних кіл і квантово-механічних систем.
Ключова відмінність між двома представленнями полягає в тому, що кожне з них розкриває: часова область показує, коли щось відбувається — де виникають піки та западини, як швидко змінюється сигнал. Частотна область показує, які частоти присутні — які синусоїдальні компоненти складають сигнал, кожна зі своєю амплітудою та фазою. Чиста музична нота — це один пік у частотній області; акорд — кілька піків; шум — енергія, розподілена по всіх частотах.
Періодичні сигнали — що повторюються нескінченно — мають дискретний набір частот, який називають рядом Фур'є: фундаментальна частота плюс гармоніки. Неперіодичні (одноразові) сигнали мають неперервний спектр: перетворення Фур'є, де енергія розподілена по континууму частот. На практиці сигнали завжди мають скінченну тривалість, тому ми працюємо з віконними сегментами та дискретним перетворенням Фур'є.
Неперервне перетворення Фур'є перетворює сигнал у часовій області x(t) на його представлення у частотній області X(f). Пряме перетворення та обернене задаються парою інтегралів:
Комплексна експонента e^{-i2πft} — ключова: за формулою Ейлера вона
дорівнює cos(2πft) − i·sin(2πft), тож інтеграл проєктує x(t) на синусоїдальну базисну
функцію на частоті f. Результат X(f) — комплексне число для кожної частоти: його
модуль |X(f)| дає спектр амплітуд (скільки присутньо кожної частоти),
а його аргумент arg(X(f)) дає спектр фаз (часовий зсув цієї частотної
компоненти відносно нуля).
На практиці сигнали дискретизуються через рівні проміжки часу. Дискретне перетворення Фур'є (DFT) бере N рівновіддалених відліків і повертає N комплексних частотних коефіцієнтів:
Тут k індексує дискретні частоти: k=0 — це постійна складова (середнє значення), k=1 — фундаментальна частота (один повний цикл на N відліків), а k=N/2 — найвища представима частота (частота Найквіста). Теорема відліків Найквіста-Шеннона стверджує, що для достовірного захоплення сигналу з частотами до fmax потрібно дискретизувати з частотою щонайменше 2·fmax відліків за секунду. Дискретизація нижче цієї частоти спричиняє накладання спектрів — високочастотний вміст «згортається» назад і видає себе за нижчі частоти, незворотно спотворюючи сигнал. Аудіо-CD дискретизують на 44 100 Гц, що достатньо для захоплення частот до 22 050 Гц — із запасом за межею людського слуху, що становить приблизно 20 000 Гц.
Обчислення DFT безпосередньо за визначенням вимагає O(N²) комплексних множень: для кожної з N вихідних частот ми підсумовуємо всі N вхідних відліків. Для односекундного аудіозапису з дискретизацією 44 100 Гц це означає N = 44 100, а N² ≈ 1,9 мільярда операцій. Для кадру відео 4K (N ≈ 8 мільйонів пікселів) пряме обчислення повністю непрактичне.
Алгоритм швидкого перетворення Фур'є Кулі-Тьюкі, опублікований 1965 року (хоча споріднені ідеї сягають Гаусса), зменшує вартість до O(N log N) завдяки блискучому підходу «розділяй і володарюй». Ключове спостереження полягає в тому, що DFT розміру N можна виразити через два DFT розміру N/2 — один над парно-індексованими вхідними відліками, а інший над непарно- індексованими — поєднаними простою операцією метелика:
Комплексний множник e^{-i2πk/N} називають твідл-фактором. Рекурсивно застосовуючи це розділення — наполовину зменшуючи задачу на кожному етапі — ми зводимо загальну роботу до N/2 · log₂(N) операцій метелика. Кожен етап вимагає рівно N/2 множень і N додавань; з log₂(N) етапами загальна вартість — O(N log N). Твідл-фактори обчислюються один раз і зберігаються, тож кожен метелик — це лише два додавання й одне множення.
FFT з основою 2 вимагає, щоб N було степенем двійки (512, 1024, 2048, ...). Практичні реалізації на кшталт FFTW використовують факторизації зі змішаною основою для ефективної обробки довільного N, автоматично обираючи найкращий алгоритм для заданого розміру під час виконання.
Перетворення Фур'є та FFT лежать в основі надзвичайного розмаїття технологій. Майже кожна система, що обробляє сигнали — природні чи штучні — покладається на частотно-областний аналіз на певному етапі свого конвеєра.
Графічні еквалайзери розділяють аудіо на частотні смуги й дозволяють незалежне керування підсиленням кожної — пряме застосування розкладання Фур'є. Алгоритми виявлення висоти тону визначають фундаментальну частоту голосу чи інструмента, знаходячи домінантний пік у спектрі. Перцептивні аудіокодеки на кшталт MP3 та AAC використовують психоакустичну модель: вони застосовують FFT для виявлення частотних компонентів, замаскованих гучнішими сусідніми компонентами або нижчих за поріг чутності, а потім відкидають або сильно квантують ці компоненти. Саме тому MP3 на 128 кбіт/с звучить майже ідентично нестисненому WAV на 1411 кбіт/с.
Стиснення JPEG працює з блоками зображення 8×8 пікселів. Кожен блок перетворюється за допомогою дискретного косинусного перетворення (DCT) — дійснозначного варіанта DFT, особливо ефективного для природних зображень, оскільки він уникає граничних артефактів DFT. Отримані 64 частотні коефіцієнти представляють блок як суперпозицію просторових частотних патернів: верхній лівий коефіцієнт — це середня яскравість (постійна складова), тоді як коефіцієнти ближче до нижнього правого кута представляють дедалі дрібніші деталі. Високочастотні коефіцієнти потім сильно квантуються (або обнуляються), оскільки людський зоровий апарат менш чутливий до дрібних просторових деталей, ніж до низькочастотної структури. Результат — драматичне зменшення розміру файлу за прийнятної візуальної якості.
Сканери магнітно-резонансної томографії не збирають зображення напряму. Натомість радіочастотні імпульси й градієнтні магнітні поля змушують ядра водню випромінювати сигнали на частотах, що кодують їхнє просторове положення. Сканер записує дані в k-просторі — частотній області анатомічного зображення. Обернене FFT, застосоване до зібраних даних k-простору, відтворює просторове зображення тканини тіла. Без FFT реконструкція МРТ тривала б години, а не секунди.
Ортогональне частотне мультиплексування (OFDM) — це схема модуляції, що використовується в 4G LTE, 5G NR, Wi-Fi та цифровому телебаченні. Замість передачі на одній несучій частоті OFDM розділяє доступну смугу пропускання на сотні чи тисячі вузьких, ортогональних піднесучих. Біти даних кодуються на кожній піднесучій незалежно. На передавачі обернене FFT об'єднує всі піднесучі в часову хвильову форму для передачі; на приймачі FFT розділяє їх назад. OFDM дуже стійкий до багатопроменевого завмирання й перешкод, тому й домінує в сучасних широкосмугових бездротових стандартах.
Аналіз Фур'є виявляє періодичність, приховану в зашумлених даних. Астрономи використовують спектральний аналіз для виявлення транзитів екзопланет як періодичних падінь яскравості зорі та для вимірювання обертання зорі за періодичністю кривої блиску. Сейсмологи розкладають записи землетрусів на нормальні моди для вивчення внутрішньої будови Землі. Нейробіологи виявляють мозкові ритми (альфа, бета, гамма-хвилі) у записах ЕЕГ. Теорема про згортку — яка стверджує, що згортка в часовій області дорівнює поточковому множенню в частотній області — уможливлює швидке множення поліномів, ефективну цифрову фільтрацію та обчислення крос-кореляцій за O(N log N), що використовуються в зіставленні сигналів і радарній обробці.
Перегляньте інтерактивні симуляції хвиль, коливань та обробки сигналів — побачте розкладання Фур'є та частотний аналіз, оживлені в реальному часі.
Ряд Фур'є представляє періодичну функцію як нескінченну суму синусоїд: f(t) = a₀/2 + Σ[aₙcos(nωt) + bₙsin(nωt)]. Коефіцієнти aₙ і bₙ обчислюються з інтегралів f, помноженого на базисні функції cos/sin. Ряди Фур'є збігаються до f(t) у всіх точках неперервності (і до середнього значення в точках розриву — явище Гіббса). Вони є основою для аналізу періодичних сигналів і розв'язання рівнянь у частинних похідних з періодичними граничними умовами.
Неперервне перетворення Фур'є (CFT) застосовується до неперервних функцій, визначених на всьому часі: F(ω) = ∫f(t)e^(-iωt)dt. Дискретне перетворення Фур'є (DFT) застосовується до скінченних послідовностей із N відліків: X[k] = Σx[n]e^(-2πikn/N). DFT — це те, що обчислюють комп'ютери. CFT — теоретичний ідеал; DFT наближає його, коли сигнали обмежені за смугою і належно дискретизовані. FFT обчислює DFT за O(N log N) замість O(N²).
Теорема про згортку стверджує, що згортка в одній області дорівнює поточковому множенню в іншій області. У часовій області: (f * g)(t) = ∫f(τ)g(t-τ)dτ. У частотній області: ℱ{f*g}(ω) = F(ω)·G(ω). Це означає, що фільтрацію можна виконати так: FFT сигналу → множення на частотну характеристику фільтра → зворотне FFT. Це набагато швидше за пряму згортку для довгих сигналів.
Принцип невизначеності Фур'є стверджує, що функція і її перетворення Фур'є не можуть бути одночасно різко сконцентрованими: σ_t · σ_ω ≥ 1/2, де σ_t і σ_ω — часовий і частотний розкид. Короткий імпульс у часовій області має широкий частотний спектр; чиста синусоїда (вузька частота) триває вічно в часі. Це математична основа принципу невизначеності Гейзенберга в квантовій механіці (σ_x · σ_p ≥ ℏ/2).
Короткочасне перетворення Фур'є (STFT) аналізує, як частотний вміст сигналу змінюється з часом. Функція ковзного вікна множиться на сигнал, і FFT обчислюється для кожної позиції вікна. Результат — спектрограма — показує час на одній осі та частоту на іншій. Довжина вікна керує компромісом між часовою та частотною роздільною здатністю: короткі вікна дають кращу часову роздільну здатність, але гіршу частотну.
Тоді як аналіз Фур'є використовує нескінченні синусоїди як базисні функції (добра частотна роздільна здатність, немає часової локалізації), вейвлет-аналіз використовує короткі, коливні базисні функції (вейвлети), локалізовані і в часі, і в частоті. Вейвлети забезпечують багаторівневий аналіз — грубе наближення плюс деталі на кожному масштабі. Застосування включають стиснення зображень (JPEG 2000 використовує вейвлети), усунення шуму, аналіз ЕКГ та обробку сейсмічних сигналів, де ознаки виникають на кількох масштабах.
Явище Гіббса — це перерегулювання в наближенні рядом Фур'є поблизу розриву стрибка. Незалежно від того, скільки гармонік підсумовано, часткова сума перевищує справжнє значення приблизно на 9% висоти стрибка в точці розриву. Воно не зникає з додаванням більшої кількості членів — воно лише наближається до розриву. Явище Гіббса впливає на цифрове аудіо, обробку зображень і чисельні розв'язки рівнянь у частинних похідних поблизу різких особливостей.
Музичні інструменти видають звуки, що є суперпозиціями гармонічних обертонів — цілих кратних фундаментальної частоти. Аналіз Фур'є розкладає будь-який музичний звук на його складові частоти, визначаючи фундаментальну висоту тону та гармонічний склад. Тембр (різниця у звучанні між скрипкою й піаніно, що грають ту саму ноту) визначається тим, які гармоніки присутні та якою є їхня відносна амплітуда. Музичні синтезатори генерують звуки, додаючи гармоніки (адитивний синтез) або фільтруючи білий шум (віднімальний синтез).
DCT перетворює сигнал на суму косинусних функцій різних частот. На відміну від DFT, воно використовує лише дійснозначні косинуси (без комплексних експонент) і має вигідну властивість компактування енергії: більшість енергії сигналу концентрується в кількох низькочастотних коефіцієнтах. JPEG використовує 8×8-блочне DCT для стиснення зображень — воно перетворює кожен блок у частотну область, квантує (відкидає) високочастотні коефіцієнти, які око майже не помічає, а потім кодує решту коефіцієнтів ентропійним кодуванням.
Перетворення Фур'є функції Гаусса — це знову функція Гаусса: ℱ{e^(-at²)}(ω) = √(π/a) · e^(-ω²/4a). Гаусіани самоподібні під перетворенням Фур'є — гаусіан у часі дає гаусіан у частоті. Вужчі гаусіани в часі дають ширші гаусіани в частоті, демонструючи принцип невизначеності. Ця властивість робить гаусіани ідеальними для віконних функцій (мінімізації часо-частотної невизначеності) і є центральною для квантової механіки (когерентні стани — це гаусові хвильові пакети).