人工智能

脑植入物和AI模型用于将思维转换为文本

发布于 2020年4月3日

更新于 2026年5月25日

作者

Daniel Nelson

加州大学旧金山分校的研究人员最近创建了一个可以通过分析一个人的脑活动来产生文本的AI系统，基本上可以将他们的想法转化为文本。该AI系统从用户那里获取神经信号并解码它们，并且可以根据一组30到50个句子的设置，在实时中解码多达250个单词。

据独立报报道，该AI模型是在四名女性的神经信号上进行训练的。实验中的参与者在大脑中植入了电极，以监测癫痫发作的发生。参与者被指示大声朗读句子，他们的神经信号被输入到AI模型中。该模型能够辨别与特定单词相关的神经活动模式，并且这些模式与实际单词的匹配度约为97%，平均错误率约为3%。

这并不是第一次将神经信号与句子相关联，神经科学家已经在类似的项目上工作了十多年。然而，研究人员创建的AI模型显示出令人印象深刻的准确性，并且基本上可以实时运行。该模型使用循环神经网络将神经活动编码为可以转换为单词的抽象表示。正如作者在他们的论文中所说：

“从最近的机器翻译进展中汲取灵感，我们训练了一个循环神经网络来编码每个句子长度的神经活动序列为抽象表示，然后将该表示解码为单词，一个一个单词地解码为英语句子。”

根据ArsTechnica的报道，为了更好地了解神经信号和单词之间的联系，研究人员通过禁用系统的不同部分进行了实验。系统的准确性是由于神经表示而变得明显。同时，也发现禁用音频输入会使错误率大幅增加，但总体性能仍然被认为是可靠的。显然，这意味着该系统可能对那些无法说话的人有用。

当禁用电极输入的不同部分时，发现该系统正在关注与语音处理和产生相关的某些关键大脑区域。例如，系统性能的一部分是基于大脑区域关注自己说话时的声音。

虽然初步结果看起来很有希望，但研究团队并不确定该模型将如何扩展到更大的词汇量。原理需要被推广到更大的词汇量，因为平均的英语使用者有大约20,000个活跃的词汇。当前的解码器方法是通过解释句子的静态结构，并使用该结构来对匹配特定神经活动模式的单词进行有根据的猜测。随着词汇量的增长，整体准确性可能会降低，因为更多的神经模式可能看起来相似。

论文的作者解释说，虽然他们希望解码器最终能够学习如何区分语言中的规则、可靠的模式，但他们不确定需要多少数据来训练一个能够概括到日常英语语言的模型。处理这个问题的一种潜在方法是用其他脑机接口和植入物收集的数据来补充训练，这些数据使用不同的算法。

加州大学研究人员的研究只是最近在神经接口和计算机研究与开发浪潮中的一项发展。去年，皇家学会发布了一份报告，预测神经接口将最终使人们能够读懂彼此的思想。该报告引用了埃隆·马斯克创立的Neuralink初创公司和Facebook开发的技术作为人类导向计算即将到来的进步的证据。皇家学会指出，人机接口将成为未来二十年内治疗神经退行性疾病（如阿尔茨海默病）的一种强大选择。皇家学会引用了Neuralink初创公司由埃隆·马斯克创立和Facebook开发的技术作为即将到来的人类导向计算的证据。皇家学会指出，人机接口将成为未来二十年内治疗神经退行性疾病（如阿尔茨海默病）的一种强大选择。

Daniel Nelson

博客作者和程序员，专攻 Machine Learning 和 Deep Learning 领域。Daniel 希望帮助他人利用 AI 的力量为社会做好事。

Unite.AI

脑植入物和AI模型用于将思维转换为文本

You may like