Connect with us

Прорыв в области ИИ улучшает интерфейсы мозг-компьютер за счет декодирования сложных сигналов мозга

Интерфейс мозг–машина

Прорыв в области ИИ улучшает интерфейсы мозг-компьютер за счет декодирования сложных сигналов мозга

mm

Исследователи в Университете Тиба в Японии разработали новую основу искусственного интеллекта, способную декодировать сложную активность мозга с значительно улучшенной точностью, что является важным шагом на пути к более надежным интерфейсам мозг-компьютер (ИМК). Этот прорыв может помочь ускорить разработку вспомогательных технологий, которые позволяют людям с неврологическими расстройствами контролировать устройства, такие как протезы, инвалидные коляски и реабилитационные роботы, используя свои мысли.

Исследование, возглавляемое аспирантом Чаовэном Шэном и профессором Акио Намики в Школе инженерии Университета Тиба, представляет новую архитектуру глубокого обучения, известную как Embedding-Driven Graph Convolutional Network (EDGCN). Система предназначена для интерпретации сложных электрических сигналов, генерируемых в мозге, когда человек представляет себе движение конечностями – процесс, известный как моторное воображение.

Интерфейсы мозг-компьютер и моторное воображение

Интерфейсы мозг-компьютер направлены на создание эффективного канала связи между человеческим мозгом и внешними машинами. Вместо того, чтобы полагаться на движение мышц, ИМК интерпретируют нейронные сигналы и преобразуют их в команды для цифровых систем или физических устройств.

Одним из наиболее широко изучаемых подходов в исследованиях ИМК является электроэнцефалография моторного воображения (MI-EEG). В этих системах пользователи представляют себе выполнение движений – таких как подъем руки, захват объекта или ходьба. Хотя нет физического движения, мозг генерирует характерные закономерности электрической активности, связанные с воображаемым движением.

Эти сигналы можно захватить с помощью электроэнцефалографии (ЭЭГ), неинвазивного метода, который записывает активность мозга через электроды, размещенные на скальпе. ЭЭГ обеспечивает многоканальную временную серию данных, представляющую нейронную активность в разных регионах мозга.

Точное декодирование этих сигналов позволяет компьютерам переводить нейронную активность в действенные команды. На практике это может позволить людям с параличом или тяжелыми двигательными нарушениями контролировать вспомогательные технологии, просто представляя себе движения.

Однако достижение надежного декодирования сигналов MI-EEG остается одним из наиболее сложных задач в нейротехнологиях.

Почему сигналы мозга трудно декодировать

Основная проблема в разработке интерфейсов мозг-компьютер заключается в внутренней сложности сигналов ЭЭГ.

Сигналы моторного воображения демонстрируют высокую пространственно-временную вариативность, то есть они варьируются как в разных регионах мозга, так и во времени. Они также сильно различаются между людьми и даже в одном и том же человеке от одной сессии к другой.

Традиционные модели машинного обучения часто испытывают трудности с этими вариациями. Многие существующие системы полагаются на предопределенные графические структуры или фиксированные параметры, которые предполагают, что сигналы мозга ведут себя в согласованной манере. На самом деле нейронные сигналы гораздо более динамичны и гетерогенными.

Ранее использовались методы, такие как анализ общих пространственных закономерностей или традиционные свёрточные нейронные сети, для извлечения функций из сигналов ЭЭГ. Хотя эти подходы могут выявить некоторые закономерности в нейронной активности, они часто не могут захватить более глубокие взаимодействия между регионами мозга или эволюционирующие закономерности во времени.

В результате многие системы ИМК требуют обширной калибровки и обучения, прежде чем они смогут функционировать эффективно для отдельных пользователей.

Новый подход: Embedding-Driven Graph Convolutional Networks

Команда исследователей в Университете Тиба решала эти проблемы, разработав новую основу глубокого обучения, предназначенную для лучшего захвата сложности активности мозга.

Их решение – Embedding-Driven Graph Convolutional Network (EDGCN) – объединяет несколько передовых методов для одновременного моделирования пространственной и временной структуры сигналов ЭЭГ.

В основе этой основы лежит механизм слияния, управляемый встраиванием, который позволяет системе динамически генерировать параметры, используемые для декодирования сигналов мозга. Вместо того, чтобы полагаться на фиксированные архитектуры, EDGCN адаптирует свое внутреннее представление для лучшего захвата вариаций между субъектами и во времени.

Архитектура интегрирует несколько специализированных компонентов:

Многоуровневое временное встраивание (MRTE)

Этот модуль анализирует сигналы ЭЭГ на разных временных масштабах. Поскольку нейронные сигналы быстро эволюционируют, важная информация может возникнуть на разных временных разрешениях. MRTE извлекает функции из многоуровневых закономерностей мощности спектра, что позволяет системе выявить значимую нейронную активность, которая могла бы быть пропущена.

Структурно-чувствительное пространственное встраивание (SASE)

Сигналы мозга не изолированы; разные регионы мозга взаимодействуют непрерывно. Механизм SASE моделирует эти взаимодействия, включая как локальные, так и глобальные структуры связности среди электродов ЭЭГ. Это позволяет ИИ представить мозг как сеть, а не как независимые сигнальные каналы.

Генерация параметров, учитывающая гетерогенность

Одним из наиболее инновационных аспектов основы EDGCN является ее способность динамически генерировать параметры свёрточных графов из банка параметров, управляемого встраиванием. Это позволяет модели адаптироваться к уникальным характеристикам сигналов мозга каждого субъекта.

Для поддержки этого процесса исследователи использовали чебышевские графовые свёрточные нейронные сети, метод, который эффективно моделирует отношения внутри сложных сетей.

Ортогонально-ограниченные ядра

Для дальнейшего повышения устойчивости модель вводит ортогональные ограничения внутри своих свёрточных ядер. Это поощряет разнообразие в извлеченных функциях и снижает избыточность, помогая системе извлекать более богатые представления из сигналов ЭЭГ.

Вместе эти компоненты позволяют EDGCN захватить как локальные закономерности нейронной активности, так и крупномасштабные взаимодействия между регионами мозга, что приводит к более точному декодированию сигналов моторного воображения.

Результаты производительности

Исследователи протестировали EDGCN, используя широко используемые наборы данных BCI Competition IV, которые являются стандартными наборами данных для оценки в области исследований интерфейсов мозг-компьютер.

Модель достигла:

  • 90,14% точности классификации на наборе данных BCIC-IV-2b
  • 86,50% точности классификации на наборе данных BCIC-IV-2a

Эти результаты превосходят несколько существующих методов декодирования на уровне искусства и демонстрируют сильную обобщаемость на разных субъектах.

Важно, что система также показала улучшенную адаптивность при применении в сценариях с разными субъектами, что является ключевым требованием для практического развертывания ИМК. Многие существующие модели хорошо работают для одного обученного пользователя, но терпят неудачу, когда применяются к новым людям. Архитектура EDGCN, управляемая встраиванием, помогает преодолеть это ограничение, лучше моделируя индивидуальную вариативность.

Последствия для реабилитации и вспомогательной технологии

Способность более точно декодировать сигналы мозга может иметь глубокие последствия для вспомогательных технологий.

ИМК на основе моторного воображения уже исследуются для применения в таких областях, как:

  • Кресла-инвалидные коляски, управляемые мыслями
  • Нейронные протезы
  • Реабилитационные роботы
  • Системы связи для пациентов с параличом

Улучшенная точность декодирования может сделать эти технологии значительно более надежными и легкими в использовании.

Исследователи считают, что системы, подобные EDGCN, могут помочь пациентам с такими состояниями, как:

  • Инсульт
  • Повреждения спинного мозга
  • Боковой амиотрофический склероз (БАС)
  • Другие невромышечные расстройства

С более надежной интерпретацией сигналов пациенты потенциально могут контролировать устройства нейрореабилитации, просто представляя себе движения, что позволит им взаимодействовать с вспомогательными системами более естественным образом.

По словам профессора Намики, декодирование сигналов моторного воображения – это не только технологическая задача, но и возможность лучше понять, как мозг организует движение и нейронную связность.

На пути к потребительским интерфейсам мозг-компьютер

Несмотря на десятилетия исследований, большинство систем интерфейсов мозг-компьютер остаются ограниченными лабораториями или специализированными клиническими учреждениями. Надежность, адаптивность и простота использования остаются значительными барьерами на пути к более широкому внедрению.

Прорывы, подобные EDGCN, могут помочь приблизить ИМК к потребительским нейротехнологиям.

Улучшая способность системы обрабатывать гетерогенные сигналы мозга, модель снижает потребность в обширной калибровке и настройке экспертов. Это является важным шагом на пути к тому, чтобы сделать системы ИМК пригодными для использования вне исследовательской среды.

Будущие исследования, вероятно, будут сосредоточены на интеграции таких моделей ИИ в портативные системы ЭЭГ и носимые устройства. В сочетании с улучшениями в технологии датчиков и вычислительной мощности эти системы могут обеспечить более доступные и масштабируемые интерфейсы мозг-машина.

Шаг к более глубокой интеграции человека и машины

Разработка EDGCN отражает более широкую тенденцию в искусственном интеллекте и нейробиологии: растущее использование графических нейронных сетей для моделирования биологических систем.

Поскольку сам мозг функционирует как сложная сеть взаимосвязанных регионов, графические нейронные сети обеспечивают естественный способ представления его структуры и динамики. По мере того, как эти модели ИИ становятся более совершенными, они могут открыть более глубокие знания о нейронной активности и когнитивных процессах.

В конечном итоге, улучшенное декодирование сигналов мозга может проложить путь к новому поколению технологий, которые позволят людям взаимодействовать с машинами более безшовным образом, чем когда-либо прежде.

Если прогресс будет продолжаться в текущем темпе, интерфейсы мозг-компьютер могут вскоре перейти от экспериментальных инструментов исследований к повседневным вспомогательным технологиям, способным восстановить независимость и подвижность миллионов людей во всем мире.

Антуан - видный лидер и сооснователь Unite.AI, движимый непоколебимой страстью к формированию и продвижению будущего ИИ и робототехники. Как серийный предприниматель, он считает, что ИИ будет столь же разрушительным для общества, как электричество, и часто увлекается потенциалом разрушительных технологий и ИИ.

Как футуролог, он посвящен изучению того, как эти инновации изменят наш мир. Кроме того, он является основателем Securities.io, платформы, ориентированной на инвестиции в передовые технологии, которые переопределяют будущее и меняют целые сектора.