人工智能
脑植入物和 AI 模型用于将思维转换为文本

加州大学旧金山分校的研究人员最近创建了一个可以通过分析一个人的脑活动产生文本的 AI 系统,基本上将他们的想法转化为文本。该 AI 系统从用户那里接收神经信号并对其进行解码,并且可以根据一组 30 到 50 个句子的实时数据解码多达 250 个单词。
据独立报报道,该 AI 模型是在四名女性的神经信号上进行训练的。实验中的参与者在大脑中植入了电极,以监测癫痫发作的发生。参与者被要求大声朗读句子,他们的神经信号被输入到 AI 模型中。该模型能够辨别出与特定单词相关的神经活动,模式与实际单词的匹配率约为 97%,平均错误率约为 3%。
这并不是第一次将神经信号与句子相关联,神经科学家已经在类似的项目上工作了十多年。然而,研究人员创建的 AI 模型显示出令人印象深刻的准确性,并且可以在几乎实时的条件下运行。该模型使用循环神经网络将神经活动编码为可以转换为单词的表示。正如作者在 他们的论文中所说:
“从最近的机器翻译进展中汲取灵感,我们训练了一个循环神经网络,以将每个句子长度的神经活动序列编码为一个抽象表示,然后将该表示解码为英语句子,一个单词接着一个单词。”
根据 ArsTechnica 的报道,为了更好地了解神经信号和单词之间的联系,研究人员通过禁用系统的不同部分进行了实验。系统化的禁用使得系统的准确性明显归因于神经表示。同时,也发现禁用音频输入会导致错误率增加,但系统的整体性能仍然被认为是可靠的。显然,这意味着该系统可能对那些无法说话的人有潜在的用途。
当禁用电极输入的不同部分时,发现系统正在关注与语音处理和产生相关的某些关键大脑区域。例如,系统性能的相当一部分是基于大脑区域对语音的关注,特别是当说话时自己的声音。
虽然初步结果看起来很有希望,但研究团队并不确定该模型将如何扩展到更大的词汇量。原理能够推广到更大的词汇量是非常重要的,因为平均的英语使用者有大约 20,000 个活跃的词汇。当前的解码方法是通过解释句子的静态结构并使用该结构对匹配特定神经活动模式的单词进行有根据的猜测。随着词汇量的增长,整体准确性可能会降低,因为更多的神经模式可能会看起来相似。
该论文的作者解释说,虽然他们希望解码器最终能够学会辨别语言中的规律、可靠的模式,但他们不确定需要多少数据来训练一个能够推广到日常英语语言的模型。解决这个问题的一种潜在方法是用其他大脑计算机接口收集的数据来补充训练,这些接口使用不同的算法和植入物。
加州大学的研究人员所做的研究只是近期在神经接口和计算机方面研究和开发的浪潮中的一项发展。英国皇家学会去年发布的一份报告预测,神经接口将使人们能够将思想直接链接到计算机,并最终实现读取彼此的思想。该报告引用了由埃隆·马斯克创立的 Neuralink 初创公司和 Facebook 开发的技术作为即将到来的人类计算进步的证据。皇家学会指出,人机接口将成为未来二十年内治疗神经退行性疾病(如阿尔茨海默病)的一种强大的选择。
