Нейронаука · Біологія · Сприйняття
📅 Квітень 2026 ⏱ ≈ 12 хв читання 🎯 Середній рівень

Як працює зорова кора — Г'юбел–Візел, ієрархія V1–V5 та нейронне кодування

Близько 30% кори головного мозку людини присвячено зору. Зорова система виокремлює краї, рух, колір, глибину та ідентичність об'єктів із шумного, низькоякісного зображення, що надходить через сітківку зі 130 мільйонами фоторецепторів. Ця стаття простежує шлях від гангліозних клітин сітківки до високорівневих зорових ділянок, охоплюючи відзначену Нобелівською премією працю Г'юбела й Візела, функціональну організацію V1, два потоки обробки та те, що нам відомо про те, як мозок кодує зорову інформацію.

1. Від сітківки до первинної зорової кори

Зорові сигнали йдуть від сітківки по зоровому нерву. У зоровому перехресті (хіазмі) волокна від носової половини кожного ока перехрещуються: волокна від лівого поля зору сходяться в правій півкулі й навпаки. Це часткове перехрещення означає, що кожна півкуля головного мозку обробляє контралатеральне поле зору.

Перше центральне реле — це латеральне колінчасте ядро (LGN) таламуса. LGN має шість шарів:

Ретинотопічне відображення: просторова організація сітківки зберігається в усій зоровій ієрархії. Сусідні позиції сітківки проєктуються на сусідні позиції кори — кора містить «карту» поля зору. Поблизу центральної ямки (висока гострота) корковий коефіцієнт збільшення становить ~6 мм/градус зорового кута; на периферії він падає до ~0.5 мм/градус.

2. V1 — первинна зорова кора

V1 (первинна зорова кора, поле Бродмана 17) у потиличній частці — головна коркова мішень виходу LGN. Вона містить найточнішу ретинотопічну карту й є найбільшою окремою зоровою ділянкою в людини (~25 см² на півкулю). V1 організована у шість шарів:

Шар 4C: основний вхідний шар від LGN ├── Шар 4Cα: отримує вхід M-клітин (магно) └── Шар 4Cβ: отримує вхід P-клітин (парво) Шар 2/3: внутрішні зв'язки V1 → V2, V3, V4, MT (прямий зв'язок) Шар 5: вихід до подушки таламуса, SC, LGN (зворотний зв'язок / моторний) Шар 6: зворотний вихід назад до LGN (таламічна модуляція)

Функціональні колонки

Нейрони V1 організовані у вертикальні колонки (~50 мкм у діаметрі), що мають спільні функціональні властивості. Два типи модулів вкривають коркову поверхню:

3. Нобелівські відкриття Г'юбела і Візела (1981)

Девід Г'юбел і Торстен Візел упродовж 1960–70-х років реєстрували окремі нейрони у первинній зоровій корі котів і мавп мікроелектродами. Їхні відкриття переформували нейронауку:

Прості клітини

Прості клітини мають видовжені, поділені рецептивні поля з виразними ON- і OFF-підобластями. Вони реагують максимально на орієнтований край чи смугу в певній позиції та орієнтації в полі зору. Їхню відповідь можна змоделювати як лінійний просторово-часовий фільтр:

Модель відповіді простої клітини (фільтр Габора): f(x, y) = exp(-(x'²/2σ_x² + y'²/2σ_y²)) · cos(2πfx' + φ) де x' = x·cos(θ) + y·sin(θ) (повернута координата) y' = -x·sin(θ) + y·cos(θ) θ — переважна орієнтація f — переважна просторова частота φ — просторова фаза (ON-центр при φ=0, OFF-центр при φ=π) Відповіді приблизно лінійні з контрастом і приблизно розділювані в просторі та часі (просторово-часова розділюваність).

Складні клітини

Складні клітини реагують на орієнтовані краї будь-де в межах свого (більшого) рецептивного поля — вони ФАЗОВО ІНВАРІАНТНІ. Переміщення орієнтованого краю через рецептивне поле спричиняє стійке збудження; клітина не розрізняє, чи край в ON-, чи в OFF-області. Моделюється як сума квадратів виходів простих клітин з протилежними просторовими фазами:

Енергетична модель складної клітини: R = (S_even)² + (S_odd)² де S_even, S_odd — відповіді простих клітин зі зсувом фази на 90°. Це дає орієнтаційну вибірковість без чутливості до просторової фази — як локальний детектор країв, стійкий до точної позиції.

Критичний період і пластичність

Г'юбел і Візел виявили, що монокулярна депривація кошенят протягом критичного періоду (приблизно 3–8 постнатальні тижні) спричиняє постійну втрату чутливості нейронів V1 до закритого ока — структурну реорганізацію колонок очного домінування. Це виявило залежну від досвіду пластичність на ранньому етапі розвитку зору й пояснило основу для вікон лікування амбліопії («ледачого ока»).

4. V2, V3, V4, MT — ієрархія

Ділянка Розташування Ключові функції Прикметні властивості
V1 Потиличний полюс (шпорна борозна) Краї, орієнтація, просторова частота, бінокулярність Найточніша ретинотопія; 6-шаровий вхід LGN
V2 Суміжна з V1 (місяцеподібна борозна) Складні краї, колір, диспаратність (глибина), ілюзорні контури Смугаста архітектура (товсті/тонкі/бліді); зворотний зв'язок до V1
V3/V3A Над/під V2 Складні форми, глобальна форма Великі рецептивні поля; менш вивчена
V4/hV4 Вентральна потилична Колір, форма, розпізнавання Сталість кольору; ураження V4 → ахроматопсія
MT/V5 Задня верхня скронева борозна Напрямок руху, швидкість, оптичний потік Напрямково-вибіркова; ураження MT → акінетопсія
MST Суміжна з MT Складний оптичний потік, напрямок руху, плавне стеження Великі рецептивні поля; >50% площі поля зору
Масштабування розміру рецептивних полів: рецептивні поля зростають з кожною наступною ділянкою. Клітини V1 мають рецептивні поля ~0.1–1° зорового кута; клітини MT інтегрують у межах 10–30°; високорівневі нижньоскроневі нейрони можуть мати рецептивні поля, що охоплюють усе поле зору.

5. Два зорові потоки

Унгерлайдер і Мішкін (1982) запропонували, що зорові сигнали роздвоюються після V1 на два паралельні шляхи обробки:

Вентральний потік (шлях «ЩО»): V1 → V2 → V4 → нижня скронева кора (IT) → вентральна префронтальна кора Функція: розпізнавання об'єктів, сприйняття облич, колір, дрібна деталізація Наслідки уражень: прозопагнозія (сліпота на обличчя), зорова агнозія, ахроматопсія Основний вхід: P-клітини (парвоцелюлярні) LGN → blob/interblob-області V1 Зміщення обробки: висока просторова частота, повільна часова, центральне поле Дорсальний потік (шлях «ДЕ/ЯК»): V1 → V2 → MT/V5 → MST → задня тім'яна кора → дорсальна префронтальна кора Функція: просторове розташування, рух, зорово-моторний контроль, дія Наслідки уражень: оптична атаксія (хибне дотягування), акінетопсія (сліпота на рух) Основний вхід: M-клітини (магноцелюлярні) LGN → шар 4B V1 Зміщення обробки: низька просторова частота, висока часова, периферійне поле Сучасне уточнення (Мілнер і Гудейл, 1995): дорсальний = «зір для дії» (онлайн моторний контроль від тім'яної кори) Вентральний = «зір для сприйняття» (свідоме розпізнавання в IT) Доказ: пацієнт DF — тяжке вентральне ураження, збережене хапання (дорсальне), але не може свідомо оцінити розмір об'єкта, орієнтацію чи форму.

6. Канали просторових частот

Зорова система розкладає зображення на кілька смуг просторових частот (циклів на градус зорового кута), аналогічно до фур'є- розкладу:

Висока просторова частота (>8 цикл/град): дрібна деталізація, ознаки літер, текстура Середня (~2–8 цикл/град): обличчя, глобальні форми Низька просторова частота (<2 цикл/град): загальна форма, вираз, емоція Клітини V1, налаштовані на просторову частоту: типова смуга пропускання = 1–1.5 октави Пікова частота: ~2 цикл/град у центральній ямці, зменшується на периферії Психофізичні експерименти з маскуванням (Блейкмор і Кемпбелл, 1969): адаптація до ґратки на одній просторовій частоті підвищує поріг виявлення лише для подібних частот (~±1 октава) — незалежність каналів. Практичний наслідок: обличчя розпізнаються переважно низькочастотними просторовими каналами (загальна форма, висота брів, лінія щелепи). Дрібна деталізація (пори, зморшки) обробляється окремо й використовується для розрізнення в межах відомої ідентичності. Розпізнавання облич: двотонові обличчя Муні (чорно-білі плями) виявляють низькочастотну глобальну обробку. Гібридні зображення (Шинс і Оліва, 1999): два накладені зображення на різних просторових частотах, кожне видиме на різних відстанях перегляду — низькі частоти здалеку, високі — зблизька.

7. Нейронне кодування та розріджені представлення

Ключове питання: як популяція нейронів представляє зорову інформацію?

Частотне кодування проти часового

Частотне кодування: інформація передається середньою частотою збудження у вікнах 100–200 мс. Просте й надійне; більшість нейронів V1 розуміють саме так. Часове кодування: інформація у точному часі спайків, синхронності спайків чи фазі осциляцій — важливе в деяких вищих ділянках, особливо для зв'язування ознак у корі.

Розріджене кодування

Ольсхаузен і Філд (1996) показали, що якщо навчати нейронну мережу представляти фрагменти природних зображень невеликою кількістю активних одиниць, навчені базисні функції спонтанно стають габороподібними — орієнтованими, локалізованими, смуговими. Ця гіпотеза розрідженого кодування припускає, що V1 еволюціонувала, щоб ефективно представляти природні зображення:

Ціль розрідженого кодування: мінімізувати: ‖I − Σᵢ aᵢ φᵢ‖² + λ Σᵢ |aᵢ| де I = фрагмент зображення, φᵢ = базисні функції (яких треба навчитися), aᵢ = активності, λ = штраф за розрідженість (норма L1) Розв'язок: базисні функції φᵢ стають орієнтованими фільтрами Габора! Збігаючись із рецептивними полями реальних простих клітин V1. У будь-який момент лише ~5–10% нейронів V1 активно збуджуються (розріджено). Перевага: менше активних одиниць → менші метаболічні витрати, менше шуму в подальшому зчитуванні, декорельоване представлення між нейронами.

фМРТ та популяційні рецептивні поля

фМРТ вимірює сигнал BOLD (залежний від рівня оксигенації крові) — гемодинамічний показник локальної нейронної активності з затримкою ~4–8 с. Ретинотопічне відображення за допомогою фазово-кодованих стимулів (обертовий клин / розширювальне кільце) виявляє V1–V4 та MT в окремих суб'єктів. Моделі популяційного рецептивного поля (pRF) оцінюють розташування на сітківці й розмір, що найкраще збуджує кожен корковий воксель, — показуючи систематичне збільшення та зростання розмірів pRF уздовж зорової ієрархії.

🧠 Дослідити біологію →