记忆的种子:构建能够记忆的人工智能
每次我们打开 ChatGPT、Claude 或 Gemini,我们都是从零开始。每一次对话、每一个提示、每一个见解,都在我们关闭标签页的那一刻被抹去。尽管我们大谈特谈智能,但今天的人工智能系统却患有一种深刻的健忘症。它们是无状态的工具,而非进化的心智。这种限制不仅不便,而且定义了人工智能本身的架构。模型可以预测下一个词元,但它们无法以有意义的方式记住之前发生的事情。即使我们构建了能够看、说和编码的多模态系统,我们仍然缺乏持久性,因此我们得到的是一种可以模仿理解、却永远无法从经验中成长的智能。 设计上的无状态这种健忘甚至不是一个缺陷——它是一个设计选择。大型语言模型为性能而优化,每个会话都为了隐私、简单性和可扩展性而相互隔离。但代价是碎片化。用户偏好、任务历史和累积知识等有价值的上下文随着聊天会话的结束而消失。具备记忆功能的智能体概述显示,跨会话的持久记忆在主流系统中仍然罕见。一些人试图通过检索增强生成(RAG)或向量数据库来修补这个缺口,这些技术可以获取相关的信息块,但这只是权宜之计。它们模仿连续性,却没有真正体现连续性。人工智能中真正的记忆需要更深层次的东西:一种让机器能够随时间推移、跨生态系统存储、验证和共享知识的方式。记忆使得人工智能智能体能够从过去的互动中学习、保留信息并维持上下文。 种子:人工智能记忆的原子单位如果人工智能能够像携带种子一样,携带其知识作为可移植且可验证的对象,在任何地方都能发芽,会怎样?这些“种子”是压缩的、标记化的记忆单元,以结构化的方式存储意义、来源和上下文。它们不是静态的数据文件,而是自包含的理解片段,能够在不同系统间被引用、查询和重用。一个种子可能包含从学到的设计模式到客户档案,再到对话的语义摘要等一切内容。每一个都带有元数据:是哪个模型产生的、在什么上下文中产生的、以及有多大的确定性。这种来源至关重要。它允许人工智能智能体信任并重用来自其他系统的信息,而不是盲目复制。这种方法反映了知识在人类网络中运作的方式。我们不会复制整个历史;我们分享提炼的见解——编码意义的压缩模式。种子旨在为机器实现同样的功能。 智能压缩与来源验证当然,压缩并不新鲜,但带有意义的压缩是。结构化的记忆机制对于智能体系统中长期对话的连贯性至关重要,例如 Mem0 架构。每个种子都包含确保可追溯性的加密签名。想象一下,一个人工智能智能体验证某个设计建议来自可靠建筑师的人工智能系统,而非未经验证的来源。这就是来源验证在起作用。它使得互操作性无需中心化成为可能:这一原则类似于去中心化身份标准如何认证在线人员和数据。一旦记忆通过加密方式与来源和意义联系起来,协作就成为可能。智能体可以交易、引用或验证彼此的知识,而无需透露敏感数据。从封闭系统到活生生的生态系统目前,人工智能生态系统类似于围墙花园。OpenAI、Google 和 Anthropic 将用户数据存储在自己的孤岛中。每个都有自己的 API、自己的微调方法、自己的规则。在一个环境中获得的见解,没有原生方式可以传递到另一个环境。这就是为什么每个助手都感觉像一个克隆品,而不是延续。基于种子的记忆层打破了这种模式。如果上下文可以传递,用户就成为记忆的所有者。研究人员可以将多年在 ChatGPT 中的人工智能辅助工作成果,瞬间注入到 Gemini 或私有模型中。创意团队可以无缝地从一个人工智能生态系统转移到另一个,而无需重新训练。智能体系统正在从孤立的模型转向协作智能体网络。这并非假设。事实上,智能体在点对点、集中式或分布式结构中协调。种子将进一步推动这一进程,允许持久、可验证的知识在整个人工智能网络中流动。在这种模式下,记忆是一种基础设施。种子就像机器的语义数据库:足够紧凑,可以存储在链上;足够丰富,在查询时可以重建完整的理解。这意味着人工智能不仅可以感知上下文,还可以携带上下文。其影响是巨大的。以医疗保健中的人工智能为例。如今,患者数据分散在无法原生交换上下文的系统中。如果医疗人工智能能够交换种子——加密的、可验证的知识胶囊——那么在不牺牲隐私的情况下,护理的连续性可以得到改善。在教育领域,学习人工智能可以将学生的进度保留为可移植的种子,确保每个系统都了解他们的水平、风格和目标。在创意产业中,种子可以实现模型之间的协作。一个智能体可以设计一个结构,另一个优化它,第三个模拟其性能,同时引用同一个共享的记忆层。这反映了从单智能体系统到多智能体生态系统的演变。所有权、伦理与数据经济但记忆也引发了所有权问题。谁拥有人工智能的知识——模型提供者还是训练它的用户?随着各国政府就数据可移植性和人工智能权利展开辩论(以欧盟《人工智能法案》为例),种子提出了一个简单的答案:记忆属于其来源。如果用户产生了一个想法,由此产生的种子可以被加密、签名并存储在其数字身份下,就像其思维的标记化片段。这不是一个比喻;这是一个用于伦理人工智能的技术框架。种子可以实现一个未来,在那里,人工智能协作不会以牺牲隐私为代价,通过将知识与来源和同意锚定在一起。随着时间的推移,这些种子可能构成新数据经济的基础,记忆本身变得可交易。模型可以从可信来源许可或引用种子,为经过验证的上下文付费,而不是原始数据。这是一种理解的经济,而非榨取的经济。智能的下一层当人工智能学会存储和共享自己的上下文时,它就停止成为一个工具,开始成为一个生态系统。种子是一种范式,一种思考智能如何成长、连接和持久的方式。今天的人工智能强大但健忘。明天的人工智能将因其记住了什么,以及由谁控制这些记忆而被铭记。