Rozhraní mozek–stroj
Zásadní průlom v telepatické komunikaci mezi lidmi a umělou inteligencí: MindSpeech dekóduje bezproblémové myšlenky do textu
V revolučním skoku vpřed v interakci mezi lidmi a umělou inteligencí vědci z MindPortal úspěšně vyvinuli MindSpeech, první model umělé inteligence schopný dekódovat nepřetržitou imaginární řeč do srozumitelného textu bez invazivních procedur. Tento pokrok představuje významný milník v hledání bezproblémové a intuitivní komunikace mezi lidmi a stroji.
Pionýrská studie: Neinvazivní dekódování myšlenek
Výzkum, provedený týmem předních odborníků a zveřejněný na arXiv a ResearchGate, demonstruje, jak MindSpeech může dekódovat složité, volné myšlenky do textu za kontrolovaných testovacích podmínek. Na rozdíl od předchozích pokusů, které vyžadovaly invazivní chirurgii nebo byly omezeny na jednoduché, memorované verbální podněty, tato studie ukazuje, že umělá inteligence může dynamicky interpretovat imaginární řeč z mozkové aktivity neinvazivně.
Výzkumníci použili přenosný, high-density Functional Near-Infrared Spectroscopy (fNIRS) systém pro monitorování mozkové aktivity, zatímco účastníci si představovali věty z různých témat. Nový přístup zahrnoval “word cloud” úkol, kde účastníci byli prezentováni slovy a požádáni, aby si představovali věty související s těmito slovy. Tento úkol pokrýval více než 90 % nejčastěji používaných slov v anglickém jazyce, vytvářející bohatou datovou sadu 433 až 827 vět na účastníka, s průměrnou délkou 9,34 slov.
Využití pokročilé umělé inteligence: Llama2 a mozkové signály
Umělá inteligence složka MindSpeech byla poháněna Llama2 Large Language Model (LLM), sofistikovaným nástrojem pro generování textu řízeným embedingy generovanými mozkovými signály. Tyto embedingy byly vytvořeny integrací mozkových signálů s kontextovými vstupními texty, umožňující umělým inteligencím generovat srozumitelný text z imaginární řeči.
Klíčové metriky, jako je BLEU-1 a BERT P skóre, byly použity pro hodnocení přesnosti modelu umělých inteligencí. Výsledky byly působivé, ukazující statisticky významná zlepšení v dekódovací přesnosti pro tři ze čtyř účastníků. Například účastník 1 měl BLEU-1 skóre významně vyšší na 0,265 ve srovnání s 0,224 s permutovanými vstupy, s p-hodnotou 0,004, což indikuje robustní výkon při generování textu úzce souvisejícího s imaginárními myšlenkami.
Mapování mozkové aktivity a školení modelu
Studie také mapovala mozkovou aktivitu související s imaginární řečí, se zaměřením na oblasti, jako je laterální temporální kůra, dorsolaterální prefrontální kůra (DLPFC) a vizuální zpracování v oblasti occipitální. Tyto výsledky jsou v souladu s předchozími výzkumy o kódování řeči a podtrhují proveditelnost použití fNIRS pro neinvazivní monitorování mozkové aktivity.
Školení modelu umělých inteligencí zahrnovalo komplexní proces prompt tuning, kde mozkové signály byly transformovány do embedingů, které byly poté použity pro řízení generování textu LLM. Tento přístup umožnil generování vět, které byly nejen lingvisticky srozumitelné, ale také semanticky podobné původním imaginárním myšlenkám.
Krok směrem k bezproblémové komunikaci mezi lidmi a umělou inteligencí
MindSpeech představuje průlomový úspěch ve výzkumu umělých inteligencí, demonstrující poprvé, že je možné dekódovat nepřetržitou imaginární řeč z mozku bez invazivních procedur. Tento vývoj otevírá cestu k více přirozené a intuitivní komunikaci s umělými inteligencemi, potenciálně transformující, jak lidé interagují s technologií.
Úspěch této studie také zdůrazňuje potenciál pro další pokroky v oboru. Zatímco technologie ještě není připravena pro široké použití, výsledky poskytují pohled do budoucnosti, kde telepatická komunikace s umělou inteligencí by mohla se stát realitou.
Implikace a budoucí výzkum
Implikace tohoto výzkumu jsou rozsáhlé, od zlepšení asistivních technologií pro lidi s komunikačními poruchami až po otevírání nových hranic v interakci mezi lidmi a počítači. Nicméně, studie také poukazuje na výzvy, které leží před námi, jako je zlepšení citlivosti a obecné použitelnosti modelu umělých inteligencí a přizpůsobení jej pro širší řadu uživatelů a aplikací.
Budoucí výzkum se bude zaměřovat na zdokonalování algoritmů umělých inteligencí, rozšiřování datové sady s více účastníky a zkoumání aplikací v reálném čase. Cílem je vytvořit skutečně bezproblémové a univerzální rozhraní mezi mozkem a počítačem, které může dekódovat širokou škálu myšlenek a nápadů do textu nebo jiných forem komunikace.
Závěr
MindSpeech je pionýrským průlomem v komunikaci mezi lidmi a umělou inteligencí, demonstrujícím úžasný potenciál neinvazivních rozhraní mezi mozkem a počítačem.
Čtenáři, kteří si přejí dozvědět se více o této společnosti, by měli přečíst náš rozhovor s Ekramem Alamem, CEO a spoluzakladatelem MindPortal, kde diskutujeme, jak MindPortal komunikuje s Large Language Models prostřednictvím mentálních procesů.


