关注我们.

脑机接口

用于将思想转化为文本的大脑植入物和人工智能模型

mm

加州大学旧金山分校的研究人员最近创建了一个人工智能系统,可以通过分析人的大脑活动来生成文本,本质上是将他们的想法转化为文本。 人工智能从用户处获取神经信号并对其进行解码,它可以根据一组 250 到 30 个句子实时破译多达 50 个单词。

据《独立报》报道,人工智能模型接受了从四名女性收集的神经信号的训练。 实验参与者的大脑中植入了电极,以监测癫痫发作的发生。 参与者被要求大声朗读句子,他们的神经信号被输入人工智能模型。 该模型能够识别与特定单词相关的神经活动,并且大约 97% 的情况下模式与实际单词一致,平均错误率约为 3%。

这并不是第一次将神经信号与句子相关联,神经科学家十多年来一直致力于类似的项目。 然而,研究人员创建的人工智能模型显示出令人印象深刻的准确性,并且或多或少是实时运行的。 该模型利用循环神经网络将神经活动编码为可以翻译为单词的表示。 正如作者所说 在他们的论文中:

“根据机器翻译的最新进展,我们训练了一个循环神经网络,将神经活动的每个句子长度序列编码为抽象表示,然后将这种表示逐字解码为英语句子。”

据 ArsTechnica 报道为了更好地理解神经信号和单词之间是如何建立联系的,研究人员通过禁用系统的不同部分进行了实验。 系统性的禁用清楚地表明系统的准确性取决于神经表征。 研究还发现,禁用系统的音频输入会导致错误跳跃,但整体性能仍然被认为是可靠的。 显然,这意味着该系统可能可以作为无法说话的人使用的设备。

当电极输入的不同部分被禁用时,我们发现系统最关注与语音处理和产生相关的某些关键大脑区域。 例如,系统性能的很大一部分取决于说话时注意自己声音的大脑区域。

虽然初步结果看起来很有希望,但研究团队不确定该模型扩展到更大词汇量的效果如何。 重要的是,该原则可以推广到更大的词汇量,因为普通英语使用者的活跃词汇量约为 20,000 个单词。 当前的解码器方法通过解释句子的静态结构并使用该结构对与特定神经活动模式匹配的单词进行有根据的猜测来进行操作。 随着词汇量的增加,整体准确性可能会降低,因为更多的神经模式可能看起来很相似。

该论文的作者解释说,虽然他们希望解码器最终能够学会如何辨别语言中规则的、可靠的模式,但他们不确定需要多少数据来训练一个能够泛化到日常英语的模型。 处理这个问题的一种潜在方法是利用不同的算法和植入物从其他脑机接口收集的数据来补充训练。

加州大学研究人员所做的研究只是神经接口和计算机不断增长的研究和开发浪潮中的最新进展。 英国皇家学会去年发布了一份报告,预测连接人与计算机的神经接口最终将让人们读懂彼此的想法。 该报告引用了埃隆·马斯克(Elon Musk)创建的 Neuralink 初创公司和 Facebook 开发的技术,作为以人为本的计算即将取得进步的证据。 英国皇家学会指出,人机界面将成为未来二十年治疗阿尔茨海默病等神经退行性疾病的有力选择。

博主和程序员,擅长 机器学习 深度学习 主题。 丹尼尔希望帮助其他人利用人工智能的力量造福社会。