Вейвлет-перетворення — мова часу та частоти
Перетворення Фур'є — один із найпотужніших інструментів математики, але воно має фундаментальне обмеження: воно каже, які частоти містить сигнал, але не коли вони виникають. Симфонія та її випадково перемішана версія матимуть однакові спектри амплітуд Фур'є. Вейвлет-перетворення вирішує це, використовуючи осциляції, локалізовані в часі, даючи картину того, як частотний вміст змінюється з часом — від сейсмограм землетрусів і фінансових часових рядів до медичної візуалізації та стандарту стиснення JPEG2000.
1. Невизначеність Гайзенберга в часово-частотному аналізі
Принцип невизначеності — це не лише твердження квантової механіки, це фундаментальна математична теорема про будь-який сигнал. Для сигналу f(t) із перетворенням Фур'є F(ω) визначимо часовий розкид Δt та частотний розкид Δω як стандартні відхилення |f(t)|² та |F(ω)|²:
Рівність досягається лише для гаусіанових сигналів (оптимальна часово-частотна локалізація). Це має пряму імплікацію для аналізу: неможливо досягти ідеальної часової роздільності та ідеальної частотної роздільності одночасно.
Короткочасне перетворення Фур'є (STFT) вирішує це, множачи сигнал на ковзне вікно g(t−τ) та обчислюючи перетворення Фур'є на кожній позиції вікна:
Але STFT має критичне обмеження: розмір вікна фіксований. Коротке вікно дає хорошу часову роздільність але погану частотну; довге вікно — хорошу частотну, але погану часову. Вейвлет-перетворення виходить із цього обмеження, використовуючи змінний розмір вікна, що автоматично адаптується до аналізованої частоти.
2. Що таке вейвлет?
Вейвлет — це функція ψ(t), що задовольняє двом умовам:
Умова нульового середнього (1) означає, що вейвлет осцилює — він має додатні та від'ємні частини, які взаємно компенсуються. Саме це робить його «вейвлетом» (маленькою хвилею). Умова допустимості (3) гарантує оберненість перетворення.
З материнського вейвлету ψ(t) родина дочірніх вейвлетів породжується масштабуванням та зсуванням:
Множник 1/√|a| гарантує, що кожен дочірній вейвлет має таку саму енергію, що й материнський. При збільшенні a вейвлет розтягується, стає ширшим і захоплює низькочастотний вміст. При зменшенні a — стискається, стає вужчим і захоплює високочастотний вміст. Це і є ключовим: вікно аналізу автоматично адаптується до аналізованого частотного діапазону.
3. Безперервне вейвлет-перетворення (CWT)
Безперервне вейвлет-перетворення сигналу f(t) визначається як скалярний добуток f з кожним дочірнім вейвлетом:
CWT виробляє 2D карту W_f(a, b) — скалограму — що показує, яка частина енергії сигналу в момент b припадає на масштаб a (обернено пропорційний частоті). Велике |W_f(a, b)|² означає, що сигнал схожий на ψ масштабу a поблизу моменту b.
Сигнал може бути ідеально відновлений із CWT через обернене CWT:
CWT є вкрай надлишковим: 1D сигнал із N відліків відображається на 2D поверхню з набагато більшою кількістю значень. Ця надлишковість корисна для аналізу та візуалізації, але марнотратна для стиснення. Для стиснення та швидкого обчислення перевага надається дискретному вейвлет-перетворенню.
Найчастіше використовувані материнські вейвлети для CWT
- Вейвлет Морле: ψ(t) = π^(−1/4) e^(iω₀t) e^(−t²/2). Комплексна синусоїда, модульована гаусіаном. Оптимальна часово-частотна локалізація. Широко використовується в геофізиці та нейронауці.
- Мексиканський капелюх (вейвлет Рікера): ψ(t) = (2/√3)π^(−1/4)(1−t²)e^(−t²/2). Друга похідна від гаусіана. Дійснозначний, хороший для виявлення гребенів та країв.
- Комплексні похідні Гаусіана: Використовуються при виявленні країв та аналізі зображень.
4. Вейвлет Хаара — простота та її ціна
Вейвлет Хаара, вперше описаний Альфредом Хааром в 1909 році, є найпростішим можливим ортонормованим вейвлетом:
Відповідна масштабувальна функція (батьківський вейвлет) — прямокутна функція: φ(t) = 1 при 0 ≤ t < 1, 0 інакше. Перетворення Хаара дискретного сигналу [x₁, x₂, x₃, x₄, ...] обчислюється рекурсивно шляхом попарних середніх (коефіцієнти апроксимації) та різниць (коефіцієнти деталей):
Перетворення Хаара має обчислювальну складність O(N), і можливі точні цілочисельні обчислення. Проте воно має суттєву слабкість: вейвлети Хаара мають лише один момент, що обнуляється, тобто можуть точно представляти лише константні функції. Ступінчаста апроксимація Хаара вносить помітні артефакти при стисненні зображень — «ефект сходинок» на межах.
5. Вейвлети Добеші та моменти, що обнуляються
Інгрід Добеші вирішила центральну проблему в 1988 році: як побудувати ортонормовані вейвлети з компактним носієм (скінченної довжини) та N моментами, що обнуляються. Вейвлет ψ має N моментів, що обнуляються, якщо:
Це означає, що вейвлет «сліпий» до поліноміальних сигналів ступеня до N−1 — вейвлет-коефіцієнти поліноміального сигналу ступеня < N дорівнюють точно нулю. Більше моментів, що обнуляються, означає:
- Гладкі ділянки сигналу дають дуже малі вейвлет-коефіцієнти (хороше стиснення).
- Лише розриви та дрібна текстура дають великі коефіцієнти.
- Масштабувальна функція та вейвлет є гладшими (краща частотна вибірковість).
Вейвлет dbN Добеші має N моментів, що обнуляються, та мінімальну ширину носія 2N−1. Ключові члени родини:
- db1 (= Хаар): 1 момент, носій [0,1]. Розривний.
- db2 (= D4): 2 моменти, носій [0,3]. Злегка гладкий.
- db4: 4 моменти, носій [0,7]. Використовується в JPEG2000 без втрат.
- db8: 8 моментів, носій [0,15]. Чудовий для сейсмічних даних.
- db20: 20 моментів. Майже ідеальна частотна вибірковість, але носій довжиною 39.
6. Багаторозрядний аналіз та швидке вейвлет-перетворення
Теоретичним фундаментом DWT є багаторозрядний аналіз (MRA), розроблений Стефаном Малла та Івом Мейєром близько 1989 року. MRA визначає послідовність вкладених підпросторів L²(ℝ):
На кожному рівні j сигнал розбивається на грубу апроксимацію (проєкція на V_j) та дрібні деталі (проєкція на W_j). Ця декомпозиція реалізується через банк фільтрів:
Ця рекурсія є алгоритмом Малла (швидке вейвлет-перетворення). Кожен рівень вдвічі зменшує кількість відліків, тому загальна кількість операцій: N + N/2 + N/4 + ... = 2N — O(N), швидше за БПФ O(N log N).
7. Дискретне вейвлет-перетворення (DWT)
Дискретне вейвлет-перетворення вибирає зразки CWT на двійковій сітці (a = 2^j, b = k · 2^j) та рекурсивно застосовує алгоритм Малла до J рівнів декомпозиції. Для сигналу довжиною N = 2^J, вихід:
DWT є ідеально оберненим: вихідний сигнал відновлюється точно (при точній арифметиці) шляхом рекурсивного застосування оберненого банку фільтрів від найгрубішого рівня.
Біортогональні вейвлети
Ортонормовані вейвлети повинні бути або симетричними (як Хаар), або мати дуже великий носій (математична теорема). Для стиснення зображень симетричні вейвлети кращі. Біортогональні вейвлети послаблюють вимогу ортогональності, дозволяючи і симетрію, і компактний носій: пари фільтрів аналізу та синтезу різні, але все одно задовольняють ідеальній реконструкції. Вейвлет CDF 9/7 (JPEG2000 стиснення з втратами) є біортогональним.
8. JPEG2000 та стиснення зображень
JPEG2000 (ISO/IEC 15444-1, 2000) замінив стандарт JPEG на основі ДКП на конвеєр стиснення на основі вейвлетів, що досягає вищої якості, особливо при великих коефіцієнтах стиснення. Конвеєр кодування:
- Перетворення кольорового простору: RGB → YCbCr (яскравість + кольоровість).
- 2D DWT: Застосування роздільного 2D вейвлет-перетворення до J=5 рівнів, що дає 16 підсмуг.
- Квантування: Ділення кожного коефіцієнта підсмуги на крок квантування Δ (тільки для стиснення з втратами).
- Ентропійне кодування EBCOT: Вбудоване блокове кодування з оптимальним усіченням — контекстно-адаптивний арифметичний кодер.
Ключові переваги JPEG2000 над JPEG:
- Без артефактів блокування: Базисні функції вейвлетів охоплюють усе зображення.
- Прогресивна передача: Вбудований потік бітів дозволяє зображенню покращуватись по мірі надходження даних.
- Стиснення з втратами та без в одному форматі.
- Кодування областей інтересу: Ділянка зображення може стискатися з набагато вищою якістю — критично для медичної візуалізації.
- Масштабована роздільність: Декодери можуть зупинитись достроково для реконструкції зображення з половинною або чвертьною роздільністю.
JPEG2000 є обов'язковим форматом для цифрового кінематографа (DCI), стандартом у медичній візуалізації DICOM, а також основою для стандартів JPEG XS та High Throughput JPEG2000 (HTJ2K) у телемовленні.
Часті запитання
Що таке вейвлет-перетворення?
Вейвлет-перетворення розкладає сигнал на компоненти різних масштабів (частот) та різних моментів часу одночасно. На відміну від перетворення Фур'є, яке використовує нескінченні синусоїди без часової локалізації, вейвлети використовують короткі осциляційні функції, зосереджені в часі, що забезпечує одночасно часову та частотну інформацію.
Чому перетворення Фур'є не може сказати, коли відбувається частота?
Перетворення Фур'є представляє сигнал як суму нескінченних синусоїд, що поширюються по всьому часу. Одна синусоїдальна компонента однаково впливає на кожний момент. Тому Фур'є каже, які частоти є в усьому сигналі, але не коли вони виникають. Чирп та випадкова мішанина тих самих частот матимуть однаковий спектр Фур'є.
Що таке принцип невизначеності Гайзенберга в обробці сигналів?
В обробці сигналів принцип невизначеності Гайзенберга стверджує, що сигнал не може бути ідеально локалізованим ні в часі, ні в частоті одночасно. Математично: Δt × Δω ≥ 1/2. Скорочення сигналу в часі неминуче розширює його в частоті і навпаки. Вейвлети обходять це, використовуючи адаптивну роздільність.
У чому різниця між CWT та DWT?
Безперервне вейвлет-перетворення (CWT) обчислює кореляцію сигналу з вейвлетом для кожного масштабу та часу, отримуючи надлишкову 2D карту. Дискретне (DWT) вибирає зразки на двійковій сітці — компактне, ненадлишкове, ідеально оборотне та ефективне представлення.
Що таке вейвлет Хаара?
Вейвлет Хаара — найпростіший вейвлет: прямокутна хвиля +1 на [0, 0.5), −1 на [0.5, 1), 0 інакше. Перетворення Хаара обчислює різниці та середні пар відліків ієрархічно. Описаний Альфредом Хааром в 1909 році, відомий ідеальною часовою, але слабкою частотною локалізацією.
Що таке вейвлети Добеші?
Вейвлети Добеші (db1=Хаар, db2, db4, ... dbN) — родина ортогональних вейвлетів, побудована Інгрід Добеші в 1988 році. Характеризуються N моментами, що обнуляються. Більше N = гладкіші вейвлети, краща частотна локалізація, ширший носій. db4 — для обробки зображень; db8–db20 — для сейсмології та біомедицини.
Що таке багаторозрядний аналіз?
Багаторозрядний аналіз (MRA), формалізований Малла та Мейєром (1989), є математичною основою DWT. Розкладає L²(R) у послідовність вкладених просторів апроксимації. Кожен рівень дає грубу апроксимацію та видалені деталі. Швидке вейвлет-перетворення обчислює DWT за O(N) операцій.
Як вейвлети використовуються в стисненні зображень?
2D вейвлет-перетворення розкладає зображення на підсмуги різних масштабів. Низькочастотні містять грубий вміст; високочастотні — деталі країв. Оскільки більшість енергії у низьких частотах, коефіцієнти високочастотних підсмуг квантуються без помітних втрат. JPEG2000 використовує CDF 9/7 (з втратами) та 5/3 (без втрат).
Як вейвлет-перетворення використовується в медичній візуалізації?
Вейвлети застосовуються для шумозаглушення (МРТ, КТ), стиснення (JPEG2000 — стандарт DICOM) та вилучення ознак (виявлення ЕКГ-хвиль, спайків в ЕЕГ, мікрокальцифікацій у мамографії). Часово-частотна локалізація ідеальна для нестаціонарних біомедичних сигналів.
Чим вейвлети кращі за короткочасне перетворення Фур'є?
STFT має фіксоване вікно — однакова роздільність на всіх частотах. Вейвлети: широке вікно на низьких частотах (хороша частотна, груба часова роздільність) та вузьке на високих (хороша часова, груба частотна). Це відповідає природним сигналам: низькочастотні події тривалі, високочастотні — минущі.