Connect with us

Прорив у штучному інтелекті покращує інтерфейси мозок-комп’ютер завдяки декодуванню складних сигналів мозку

Інтерфейс мозок–машина

Прорив у штучному інтелекті покращує інтерфейси мозок-комп’ютер завдяки декодуванню складних сигналів мозку

mm

Дослідники з Chiba University в Японії розробили нову структуру штучного інтелекту, здатну декодувати складну мозкову активність зі значно покращеною точністю, що є важливим кроком до створення надійніших інтерфейсів мозок-комп’ютер (BCI). Цей прорив може допомогти прискорити розробку допоміжних технологій, які дозволяють людям з неврологічними захворюваннями керувати пристроями, такими як протези кінцівок, інвалідні візки та реабілітаційні роботи, за допомогою думок. Дослідження, проведене під керівництвом аспіранта Чаовена Шена та професора Акіо Намікі з Вищої школи інженерії Університету Тіба, представляє нову архітектуру глибокого навчання, відому як Embedding-Driven Graph Convolutional Network (EDGCN). Система розроблена для інтерпретації складних електричних сигналів, що генеруються в мозку, коли людина уявляє рух кінцівками — процес, відомий як моторна уява.

Інтерфейси мозок-комп’ютер та моторна уява

Інтерфейси мозок-комп’ютер мають на меті створити прямий канал зв’язку між людським мозком і зовнішніми машинами. Замість того, щоб покладатися на рух м’язів, BCI інтерпретують нейронні сигнали та перетворюють їх на команди для цифрових систем або фізичних пристроїв. Одним із найбільш вивчених підходів у дослідженнях BCI є електроенцефалографія на основі моторної уяви (MI-EEG). У таких системах користувачі уявляють виконання рухів — наприклад, підняття руки, захоплення предмета або ходьбу. Незважаючи на те, що фізичного руху не відбувається, мозок генерує характерні візерунки електричної активності, пов’язані з уявленим рухом. Ці сигнали можна захопити за допомогою електроенцефалографії (EEG), неінвазивної техніки, яка реєструє мозкову активність через електроди, розміщені на шкірі голови. EEG надає багатоканальні часові ряди даних, що представляють нейронну активність у різних областях мозку. Точне декодування цих сигналів дозволяє комп’ютерам перекладати нейронну активність у дієві команди. На практиці це могло б дозволити людям з паралічем або важкими руховими порушеннями керувати допоміжними технологіями, просто уявляючи рухи. Однак досягнення надійного декодування сигналів MI-EEG залишається однією з найскладніших проблем у нейротехнологіях.

Чому сигнали мозку важко декодувати

Основна перешкода в розвитку інтерфейсів мозок-комп’ютер полягає у властивій складності сигналів EEG. Сигнали моторної уяви демонструють високу просторово-часову мінливість, тобто вони варіюються як у різних областях мозку, так і в часі. Вони також сильно відрізняються між окремими особами і навіть у однієї й тієї ж людини від однієї сесії до іншої. Традиційні моделі машинного навчання часто не справляються з цими варіаціями. Багато існуючих систем покладаються на попередньо визначені графові структури або фіксовані параметри, які припускають, що сигнали мозку поводяться за послідовними шаблонами. Насправді нейронні сигнали набагато динамічніші та неоднорідні. Раніші методи часто використовували такі техніки, як аналіз загальної просторової картини або звичайні згорткові нейронні мережі для вилучення ознак із сигналів EEG. Хоча ці підходи можуть виявляти деякі візерунки в нейронній активності, вони часто не здатні захопити глибші взаємодії між областями мозку або еволюціонуючі візерунки в часі. Як наслідок, багато систем BCI потребують тривалої калібрування та навчання, перш ніж вони зможуть ефективно функціонувати для окремих користувачів.

Новий підхід: Embedding-Driven Graph Convolutional Networks

Дослідницька команда Університету Тіба вирішила ці проблеми, розробивши нову структуру глибокого навчання, призначену для кращого захоплення складності мозкової активності. Їхнє рішення — Embedding-Driven Graph Convolutional Network (EDGCN) — поєднує кілька передових технік для одночасного моделювання просторової та часової структури сигналів EEG. В основі структури лежить механізм злиття на основі вбудовування, який дозволяє системі динамічно генерувати параметри, що використовуються для декодування сигналів мозку. Замість того, щоб покладатися на фіксовані архітектури, EDGCN адаптує своє внутрішнє представлення, щоб краще захопити варіації між суб’єктами та в часі. Архітектура інтегрує кілька спеціалізованих компонентів:

Multi-Resolution Temporal Embedding (MRTE)

Цей модуль аналізує сигнали EEG на різних часових масштабах. Оскільки нейронні сигнали швидко еволюціонують, важлива інформація може виникати на різних часових роздільних здатностях. MRTE витягує ознаки з багатороздільних спектральних візерунків потужності, дозволяючи системі ідентифікувати значущу нейронну активність, яка в іншому випадку могла б бути пропущена.

Structure-Aware Spatial Embedding (SASE)

Сигнали мозку не ізольовані; різні області мозку взаємодіють безперервно. Механізм SASE моделює ці взаємодії, інкорпоруючи як локальні, так і глобальні структури зв’язності між електродами EEG. Це дозволяє ШІ представляти мозок як мережу, а не як незалежні канали сигналу.

Heterogeneity-Aware Parameter Generation

Одним із найбільш інноваційних аспектів структури EDGCN є її здатність динамічно генерувати параметри графової згортки з банку параметрів на основі вбудовування. Це дозволяє моделі адаптуватися до унікальних характеристик сигналів мозку кожного суб’єкта. Для підтримки цього процесу дослідники використовували Chebyshev graph convolution, техніку, яка ефективно моделює взаємозв’язки в складних мережах.

Orthogonality-Constrained Kernels

Для подальшого підвищення надійності модель вводить ортогональні обмеження в своїх згорткових ядрах. Це сприяє різноманітності вивчених ознак і зменшує надмірність, допомагаючи системі витягувати багатші представлення з сигналів EEG. Разом ці компоненти дозволяють EDGCN захоплювати як локальні візерунки нейронної активності, так і масштабні взаємодії між областями мозку, що призводить до більш точного декодування сигналів моторної уяви.

Результати продуктивності

Дослідники протестували EDGCN, використовуючи широко відомі набір даних для порівняння з BCI Competition IV, які є стандартними наборами даних для оцінки в галузі досліджень інтерфейсів мозок-комп’ютер. Модель досягла:

  • 90,14% точності класифікації на наборі даних BCIC-IV-2b
  • 86,50% точності класифікації на наборі даних BCIC-IV-2a

Ці результати перевершують кілька існуючих передових методів декодування та демонструють сильну узагальненість для різних суб’єктів. Важливо, що система також показала покращену адаптивність при застосуванні в міжсуб’єктних сценаріях, що є ключовою вимогою для практичного впровадження BCI. Багато існуючих моделей добре працюють для одного навченого користувача, але зазнають невдачі при застосуванні до нових осіб. Архітектура EDGCN на основі вбудовування допомагає подолати це обмеження, краще моделюючи індивідуальну мінливість.

Наслідки для реабілітації та допоміжних технологій

Здатність точніше декодувати сигнали мозку може мати глибокі наслідки для допоміжних технологій. BCI на основі моторної уяви вже досліджуються для таких застосувань, як:

  • Візки, що керуються думками
  • Нейропротези
  • Роботизовані реабілітаційні пристрої
  • Системи зв’язку для пацієнтів з паралічем

Покращена точність декодування може зробити ці технології значно надійнішими та простішими у використанні. Дослідники вважають, що такі системи, як EDGCN, можуть допомогти пацієнтам із станами, включаючи:

  • Інсульт
  • Травми спинного мозку
  • Бічний аміотрофічний склероз (ALS)
  • Інші нейром’язово-скелетні розлади

Завдяки надійнішій інтерпретації сигналів пацієнти потенційно зможуть керувати нейрореабілітаційними пристроями за допомогою простих уявлених рухів, забезпечуючи більш природну взаємодію з допоміжними системами. На думку професора Намікі, декодування сигналів моторної уяви — це не лише технологічний виклик, але й можливість краще зрозуміти, як мозок організовує рух і нейронну зв’язність.

До побутових інтерфейсів мозок-комп’ютер

Незважаючи на десятиліття досліджень, більшість систем інтерфейсів мозок-комп’ютер залишаються обмеженими лабораторіями або спеціалізованими клінічними умовами. Надійність, адаптивність та простота використання залишаються значними бар’єрами для ширшого впровадження. Такі досягнення, як EDGCN, можуть допомогти наблизити BCI до побутових нейротехнологій. Покращуючи здатність системи обробляти неоднорідні сигнали мозку, модель зменшує потребу в тривалій калібруванні та експертному налаштуванні. Це критичний крок до того, щоб зробити системи BCI придатними для використання поза дослідницьким середовищем. Майбутні дослідження, ймовірно, зосередяться на інтеграції таких моделей ШІ в портативні системи EEG та носими пристрої. У поєднанні з покращеннями в технології сенсорів та обчислювальної потужності ці системи могли б забезпечити більш доступні та масштабовані інтерфейси мозок-машина.

Крок до глибшої інтеграції людини та машини

Розробка EDGCN відображає ширшу тенденцію в галузі штучного інтелекту та нейронауки: дедалі більше використання графових нейронних мереж для моделювання біологічних систем. Оскільки сам мозок функціонує як складна мережа взаємопов’язаних областей, графові нейронні мережі надають природний спосіб представлення його структури та динаміки. У мі

//www.futurist.ai">футурист, він присвячує себе дослідженню того, як ці інновації формують наш світ. Крім того, він є засновником Securities.io — платформи, що спеціалізується на інвестуванні в передові технології, які перевизначають майбутнє та змінюють цілі галузі.