Connect with us

Průlom v oblasti umělé inteligence zlepšuje rozhraní mozek-počítač dekódováním komplexních mozkových signálů

Rozhraní mozek–stroj

Průlom v oblasti umělé inteligence zlepšuje rozhraní mozek-počítač dekódováním komplexních mozkových signálů

mm

Vědci z Chiba University v Japonsku vyvinuli novou umělou inteligenci, která je schopná dekódovat komplexní mozkovou aktivitu s výrazně vyšší přesností, což představuje důležitý krok směrem k více spolehlivým rozhraním mozek-počítač (BCI). Tento průlom může urychlit vývoj asistivních technologií, které umožňují lidem s neurologickými poruchami ovládat zařízení, jako jsou protetické končetiny, vozíky a rehabilitační roboty, pomocí svých myšlenek.

Výzkum, který vedl doktorand Chaowen Shen a profesor Akio Namiki na Fakultě inženýrství Chiba University, představuje novou architekturu hlubokého učení nazvanou Embedding-Driven Graph Convolutional Network (EDGCN). Systém je navržen tak, aby interpretoval komplexní elektrické signály generované v mozku, když si člověk představuje pohyb končetin – proces známý jako motorická imaginace.

Rozhraní mozek-počítač a motorická imaginace

Rozhraní mozek-počítač mají za cíl vytvořit efektivní komunikační kanál mezi lidským mozkem a externími stroji. Místo toho, aby se spoléhaly na pohyb svalů, BCI interpretují neurální signály a převádějí je na příkazy pro digitální systémy nebo fyzická zařízení.

Jedním z nejvíce studovaných přístupů ve výzkumu BCI je motorická imaginace elektroencefalografie (MI-EEG). V těchto systémech uživatelé představují pohyby – jako zvedání ruky, uchopení předmětu nebo chůzi. I když nedochází k žádnému fyzickému pohybu, mozek generuje charakteristické vzorce elektrické aktivity spojené s představovaným pohybem.

Tyto signály lze zachytit pomocí elektroencefalografie (EEG), neinvazivní techniky, která zaznamenává mozkovou aktivitu prostřednictvím elektrod umístěných na skalpu. EEG poskytuje multi-kanálová časová data reprezentující neurální aktivitu v různých oblastech mozku.

Přesné dekódování těchto signálů umožňuje počítačům převést neurální aktivitu na proveditelné příkazy. V praxi by to mohlo umožnit lidem s paralýzou nebo závažným motorickým postižením ovládat asistivní technologie jednoduše představováním pohybů.

Nicméně, dosažení spolehlivého dekódování signálů MI-EEG zůstává jednou z nejvíce difících výzev v neurotechnologii.

Proč jsou mozkové signály obtížné dekódovat

Hlavní překážka ve vývoji rozhraní mozek-počítač spočívá v inherentní komplexitě signálů EEG.

Signály motorické imaginace vykazují vysokou prostorově-časovou variabilitu, což znamená, že se liší jak v různých oblastech mozku, tak v čase. Liší se také široce mezi jednotlivci a dokonce i u stejné osoby z jedné relace do druhé.

Tradiční modely strojového učení často zápasí s těmito variacemi. Mnoho existujících systémů se spoléhá na předem definované grafické struktury nebo pevné parametry, které předpokládají, že mozkové signály se chovají konzistentním způsobem. Ve skutečnosti jsou neurální signály mnohem více dynamické a heterogenní.

Dřívější metody často používaly techniky, jako je analýza společných prostorových vzorců nebo konvenční konvoluční neuronové sítě, pro extrakci funkcí z EEG signálů. Zatímco tyto přístupy mohou identifikovat některé vzorce v neurální aktivitě, často selhávají při zachycení hlubších interakcí mezi oblastmi mozku nebo evolucí vzorců v čase.

Jako výsledek, mnoho systémů BCI vyžaduje rozsáhlou kalibraci a trénink, než mohou fungovat efektivně pro jednotlivé uživatele.

Nový přístup: Embedding-Driven Graph Convolutional Networks

Výzkumný tým z Chiba University řešil tyto výzvy vyvinutím nové architektury hlubokého učení, která je navržena tak, aby lépe zachytila komplexitu mozkové aktivity.

Jejich řešení – Embedding-Driven Graph Convolutional Network (EDGCN) – kombinuje několik pokročilých technik pro modelování prostorové a časové struktury EEG signálů současně.

V jádru architektury je mechanismus embedování, který umožňuje systému dynamicky generovat parametry používané pro dekódování mozkových signálů. Místo toho, aby se spoléhal na pevné architektury, EDGCN přizpůsobuje svou vnitřní reprezentaci, aby lépe zachytil variace mezi subjekty a v čase.

Architektura integruje několik specializovaných komponent:

Multi-Resolution Temporal Embedding (MRTE)

Tento modul analyzuje EEG signály v různých časových škálách. Protože neurální signály se vyvíjejí rychle, důležité informace mohou nastat v různých časových rozlišeních. MRTE extrahuje funkce z multi-rozlišení power spektrálních vzorců, což umožňuje systému identifikovat významnou neurální aktivitu, která by jinak mohla být přehlédnuta.

Structure-Aware Spatial Embedding (SASE)

Mozkové signály nejsou izolované; různé oblasti mozku interagují kontinuálně. Mechanismus SASE modeluje tyto interakce tím, že zahrnuje jak lokální, tak globální konektivní struktury mezi EEG elektrodami. To umožňuje AI reprezentovat mozek jako síť spíše než jako nezávislé signálové kanály.

Heterogeneity-Aware Parameter Generation

Jedním z nejvíce inovativních aspektů architektury EDGCN je jeho schopnost dynamicky generovat parametry grafické konvoluce z embedování-driven parametrů. To umožňuje modelu přizpůsobit se jedinečným charakteristikám mozkových signálů každého subjektu.

Pro podporu tohoto procesu výzkumníci použili Chebyshev grafickou konvoluci, techniku, která efektivně modeluje vztahy v komplexních sítích.

Orthogonality-Constrained Kernels

Pro další zlepšení robustnosti model zavedl ortogonální omezení uvnitř svých konvolučních jader. To podporuje rozmanitost naučených funkcí a snižuje redundanci, což pomáhá systému extrahovat bohatší reprezentace z EEG signálů.

Společně tyto komponenty umožňují EDGCN zachytit jak lokální neurální aktivitu, tak velké interakce mezi oblastmi mozku, což vede k přesnějšímu dekódování signálů motorické imaginace.

Výsledky výkonu

Výzkumníci otestovali EDGCN pomocí široce používaných benchmarkových datových sad z BCI Competition IV, které jsou standardními evaluačními datovými sadami ve výzkumu rozhraní mozek-počítač.

Model dosáhl:

  • 90,14% klasifikační přesnost na datové sadě BCIC-IV-2b
  • 86,50% klasifikační přesnost na datové sadě BCIC-IV-2a

Tyto výsledky překonávají několik stávajících state-of-the-art dekódovacích metod a demonstrují silnou generalizaci přes různé subjekty.

Důležitým způsobem se systém také ukázal jako lépe adaptabilní, když byl aplikován na cross-subjektové scénáře, což je klíčový požadavek pro praktické nasazení BCI. Mnoho stávajících modelů funguje dobře pro jednoho trénovaného uživatele, ale selhává, když je aplikováno na nové osoby. Architektura EDGCN pomáhá překonat tuto limitaci lépe modelováním individuální variability.

Důsledky pro rehabilitaci a asistivní technologie

Schopnost dekódovat mozkové signály přesněji by mohla mít hluboké důsledky pro asistivní technologie.

Rozhraní mozek-počítač založená na motorické imaginaci jsou již zkoumána pro aplikace, jako jsou:

  • Vozy ovládané myšlenkami
  • Neurální protézy
  • Rehabilitační roboty
  • Komunikační systémy pro pacienty s paralýzou

Zlepšená přesnost dekódování by mohla tyto technologie učinit mnohem spolehlivějšími a snadněji ovladatelnými.

Výzkumníci se domnívají, že systémy, jako je EDGCN, mohou pomoci pacientům s podmínkami, jako jsou:

  • Mozkový úder
  • Poranění míchy
  • Amyotrofická laterální skleróza (ALS)
  • Jiné neuromuskulární poruchy

S více spolehlivou interpretací signálů by pacienti mohli potenciálně ovládat neurorehabilitační zařízení pomocí jednoduchých představovaných pohybů, umožňujících více přirozenou interakci s asistivními systémy.

Podle profesora Namiki je dekódování signálů motorické imaginace nejen technologickou výzvou, ale také příležitostí lépe porozumět, jak mozek organizuje pohyb a neurální konektivitu.

Směrem k spotřebitelským rozhraním mozek-počítač

Navzdory desetiletím výzkumu zůstávají většina systémů rozhraní mozek-počítač omezena na laboratoře nebo specializovaná klinická prostředí. Spolehlivost, adaptabilita a snadnost použití zůstávají významnými bariérami pro širší přijetí.

Pokroky, jako je EDGCN, mohou pomoci posunout rozhraní mozek-počítač blíže k spotřebitelské neurotechnologii.

Slezáním schopnosti systému zpracovat heterogenní mozkové signály, model snižuje potřebu rozsáhlé kalibrace a odborného ladění. To je kritický krok směrem k tomu, aby systémy BCI byly použitelné mimo výzkumná prostředí.

Budoucí výzkum se pravděpodobně zaměří na integraci takových AI modelů do přenosných EEG systémů a nositelných zařízení. V kombinaci se zlepšením senzorové technologie a výpočetní moci by tyto systémy mohly umožnit více přístupná a škálovatelná rozhraní mozek-stroj.

Krok směrem k hlubší integraci člověk-stroj

Vývoj EDGCN odráží širší trend v umělých inteligencích a neurovědách: rostoucí použití grafických neuronových sítí pro modelování biologických systémů.

Protože mozek sám funguje jako komplexní síť propojených oblastí, grafické neuronové sítě poskytují přirozený způsob, jak reprezentovat jeho strukturu a dynamiku. Jak tyto AI modely budou stále více sofistikované, mohou odemknout hlubší poznatky o neurální aktivitě a kognici.

Nakonec, zlepšená dekódování mozkových signálů by mohla otevřít cestu pro novou generaci technologií, které umožňují lidem interagovat se stroji více bezproblémově než kdykoli předtím.

Pokud pokrok bude pokračovat v současném tempu, rozhraní mozek-počítač mohou brzy přejít z experimentálních výzkumných nástrojů na každodenní asistivní technologie, které mohou obnovit nezávislost a mobilitu milionů lidí po celém světě.

Antoine je vizionářský líder a zakládající partner Unite.AI, poháněný neotřesitelnou vášní pro formování a propagaci budoucnosti AI a robotiky. Jako sériový podnikatel věří, že AI bude mít na společnost stejně disruptivní vliv jako elektřina, a často je chycen při tom, jak hovoří o potenciálu disruptivních technologií a AGI. Jako futurist, je zasvěcen prozkoumání toho, jak tyto inovace budou formovat náš svět. Kromě toho je zakladatelem Securities.io, platformy zaměřené na investice do špičkových technologií, které předefinovávají budoucnost a mění celé sektory.