Інтерфейс мозок–машина
Прорив у сфері штучного інтелекту покращує інтерфейси «мозок-комп’ютер» шляхом декодування складних сигналів мозку

Дослідники в Чібському університеті в Японії розробили нову структуру штучного інтелекту, здатну декодувати складну активність мозку з суттєво покращеною точністю, що є важливим кроком до більш надійних інтерфейсів «мозок-комп’ютер» (BCI). Цей прорив може прискорити розвиток технологій допомоги, які дозволяють людям з неврологічними захворюваннями керувати пристроями, такими як протези кінцівок, інвалідні коляски та реабілітаційні роботи за допомогою своїх думок.
Дослідження, яке проводили аспірант Чаовен Шен та професор Акіо Намікі в аспірантурі інженерного факультету Чібського університету, представляє нову архітектуру глибинного навчання, відому як Embedding-Driven Graph Convolutional Network (EDGCN). Система призначена для інтерпретації складних електричних сигналів, що генеруються в мозку, коли людина уявляє рух кінцівок — процес, відомий як рухова уявність.
Інтерфейси «мозок-комп’ютер» та рухова уявність
Інтерфейси «мозок-комп’ютер» спрямовані на створення ефективного каналу зв’язку між людським мозком та зовнішніми машинами. Замість використання руху м’язів, BCI інтерпретують нейронні сигнали та перетворюють їх у команди для цифрових систем або фізичних пристроїв.
Одним з найбільш вивчених підходів у дослідженнях BCI є електроенцефалографія рухової уявності (MI-EEG). У цих системах користувачі уявляють собі рухи — наприклад, підняття руки, захоплення об’єкта чи ходьба. Хоча жодного фізичного руху не відбувається, мозок генерує характерні закономірності електричної активності, пов’язані з уявленим рухом.
Ці сигнали можна захопити за допомогою електроенцефалографії (EEG), неінвазивної техніки, яка реєструє активність мозку через електроди, розташовані на скальпі. EEG забезпечує багатоканальну часову серію даних, що представляє нейронну активність у різних регіонах мозку.
Точне декодування цих сигналів дозволяє комп’ютерам перекладати нейронну активність на виконувані команди. На практиці це може дозволити людям з паралічем або серйозними порушеннями рухової функції керувати технологіями допомоги просто уявляючи рухи.
Однак досягнення надійного декодування сигналів MI-EEG залишається одним з найбільш складних завдань у нейротехнології.
Чому сигнали мозку складно декодувати
Основна перешкода у розробці інтерфейсів «мозок-комп’ютер» полягає у вродженої складності сигналів EEG.
Сигнали рухової уявності демонструють високу просторово-часову мінливість, тобто вони змінюються як у різних регіонах мозку, так і в часі. Вони також суттєво відрізняються між окремими людьми та навіть у однієї й тієї ж людини від однієї сесії до іншої.
Традиційні моделі машинного навчання часто мають труднощі з цими варіаціями. Багато існуючих систем спираються на попередньо визначені графічні структури або фіксовані параметри, які припускають, що сигнали мозку поводяться у сталих закономірностях. Насправді нейронні сигнали значно більш динамічні та гетерогеневі.
Раніші методи часто використовували техніки, такі як аналіз спільних просторових закономірностей або традиційні конволюційні нейронні мережі, для виділення ознак з сигналів EEG. Хоча ці підходи можуть визначити деякі закономірності в нейронній активності, вони часто не можуть захопити глибші взаємодії між регіонами мозку або еволюційні закономірності у часі.
В результаті багато систем BCI вимагають тривалої калібрування та навчання, перш ніж вони можуть функціонувати ефективно для окремих користувачів.
Новий підхід: Embedding-Driven Graph Convolutional Networks
Дослідницька група в Чібському університеті подолала ці виклики, розробивши нову структуру глибинного навчання, призначену для кращого захоплення складності активності мозку.
Їхнє рішення — Embedding-Driven Graph Convolutional Network (EDGCN) — поєднує кілька просунутих технік для моделювання просторової та часової структури сигналів EEG одночасно.
У центрі структури лежить механізм злиття на основі вкладення, який дозволяє системі динамічно генерувати параметри, використовувані для декодування сигналів мозку. Замість спирання на фіксовані архітектури EDGCN адаптує свій внутрішній вигляд, щоб краще захопити варіації між суб’єктами та у часі.
Архітектура інтегрує кілька спеціалізованих компонентів:
Мультірезолюційна часова вкладка (MRTE)
Цей модуль аналізує сигнали EEG на різних часових масштабах. Оскільки нейронні сигнали швидко змінюються, важлива інформація може виникнути на різних часових роздільностях. MRTE виділяє ознаки з мультірезолюційних закономірностей спектральної потужності, що дозволяє системі визначити значимі нейронні активності, які інакше могли б бути пропущені.
Структурно-чутлива просторова вкладка (SASE)
Сигнали мозку не ізольовані; різні регіони мозку взаємодіють безперервно. Механізм SASE моделює ці взаємодії, включаючи як локальні, так і глобальні структури з’єднань серед електродів EEG. Це дозволяє штучному інтелекту представляти мозок як мережу, а не як незалежні сигнальні канали.
Генерація параметрів, чутлива до гетерогенності
Одним з найбільш інноваційних аспектів структури EDGCN є її здатність динамічно генерувати параметри графових конволюцій з банку параметрів на основі вкладення. Це дозволяє моделі адаптуватися до унікальних характеристик сигналів мозку кожного суб’єкта.
Для підтримки цього процесу дослідники використали Чебишеву графову конволюцію, техніку, яка ефективно моделює взаємодії у складних мережах.
Ядра з ортогональними обмеженнями
Для подальшого покращення стійкості модель вводить ортогональні обмеження у своїх конволюційних ядрах. Це сприяє різноманітності вивчених ознак і зменшує надмірність, допомагаючи системі виділяти більш багаті представлення з сигналів EEG.
Всі ці компоненти дозволяють EDGCN захоплювати як локальні закономірності нейронної активності, так і великомасштабні взаємодії між регіонами мозку, що призводить до більш точного декодування сигналів рухової уявності.

Результати виконання
Дослідники протестували EDGCN, використовуючи широко використовувані набори даних BCI Competition IV, які є стандартними наборами даних для оцінки у сфері досліджень інтерфейсів «мозок-комп’ютер».
Модель досягла:
- 90,14% точності класифікації на наборі даних BCIC-IV-2b
- 86,50% точності класифікації на наборі даних BCIC-IV-2a
Ці результати перевершують кілька існуючих методів декодування стану мистецтва та демонструють сильну узагальненість серед різних суб’єктів.
Важливо, що система також показала покращену адаптивність при застосуванні до міжсуб’єктних сценаріїв, що є ключовим вимогами для практичної реалізації BCI. Багато існуючих моделей добре працюють для одного навченого користувача, але відмовляються, коли застосовуються до нових осіб. Архітектура EDGCN на основі вкладення допомагає подолати цю обмеження, краще моделюючи індивідуальну варіативність.
Наслідки для реабілітації та технологій допомоги
Спроможність декодувати сигнали мозку більш точно може мати глибокі наслідки для технологій допомоги.
Інтерфейси «мозок-комп’ютер» на основі рухової уявності вже досліджуються для застосування, таких як:
- Коляски, керовані думками
- Нейронні протези
- Роботизовані реабілітаційні пристрої
- Системи зв’язку для пацієнтів з паралічем
Покращена точність декодування може зробити ці технології значно більш надійними та легкими у використанні.
Дослідники вважають, що системи, подібні до EDGCN, можуть допомогти пацієнтам з захворюваннями, включаючи:
- Інсульт
- Травми спинного мозку
- Аміотрофічний латеральний склероз (ALS)
- Інші невром’язові порушення
З більш надійним тлумаченням сигналів пацієнти потенційно можуть керувати нейрореабілітаційними пристроями за допомогою простих уявлених рухів, забезпечуючи більш природну взаємодію з системами допомоги.
Згідно з професором Намікі, декодування сигналів рухової уявності не лише технологічний виклик, але й можливість краще зрозуміти, як мозок організовує рух та нейронну взаємодію.
У бік споживчих інтерфейсів «мозок-комп’ютер»
Незважаючи на десятиліття досліджень, більшість систем інтерфейсів «мозок-комп’ютер» залишаються обмеженими лабораторіями або спеціалізованими клінічними умовами. Надійність, адаптивність та зручність використання залишаються суттєвими бар’єрами для ширшого впровадження.
Такі досягнення, як EDGCN, можуть допомогти інтерфейсам «мозок-комп’ютер» наблизитися до споживчих нейротехнологій.
Покращуючи здатність системи обробляти гетерогенні сигнали мозку, модель зменшує потребу у тривалій калібрування та налаштуванні експертами. Це є важливим кроком до того, щоб зробити системи BCI придатними для використання поза дослідницькими середовищами.
Майбутні дослідження, ймовірно, будуть зосереджені на інтеграції таких моделей штучного інтелекту у портативні системи EEG та носимі пристрої. У поєднанні з покращеннями у технології сенсорів та обчислювальної потужності ці системи можуть забезпечити більш доступні та масштабовані інтерфейси «мозок-машина».
Крок до глибшої інтеграції людини та машини
Розробка EDGCN відображає ширшу тенденцію у штучному інтелекті та нейробіології: зростаюче використання графічних нейронних мереж для моделювання біологічних систем.
Оскільки сам мозок працює як складна мережа взаємопов’язаних регіонів, графічні нейронні мережі забезпечують природний спосіб представлення його структури та динаміки. Коли ці моделі штучного інтелекту стають більш просунутими, вони можуть розкрити глибші знання про нейронну активність та когнітивні процеси.
У кінцевому підсумку, покращене декодування сигналів мозку може відкрити шлях для нового покоління технологій, які дозволять людям взаємодіяти з машинами більш безшовно, ніж будь-коли раніше.
Якщо прогрес триватиме у поточному темпі, інтерфейси «мозок-комп’ютер» можуть скоро перейти від експериментальних дослідницьких інструментів до повсякденних технологій допомоги, здатних відновити незалежність та рухливість для мільйонів людей у світі.












