观点
ChatGPT的记忆限制令人沮丧 —— 大脑显示了更好的方式

如果您是ChatGPT的重度用户,您可能最近遇到了令人害怕的“内存已满”屏幕。这条消息出现在您达到ChatGPT保存的记忆限制时,它可能会在长期项目中成为一个重大的障碍。内存应该是复杂、持续任务的关键功能——您希望您的AI能够在未来输出中保留之前会话的知识。在时间敏感的项目中间(例如,当我正在排除我们的一个姊妹网站的持续HTTP 502服务器错误时)看到内存满警告可能会非常令人沮丧和破坏性。
ChatGPT的记忆限制的沮丧
核心问题不是内存限制的存在——即使是付费的ChatGPT Plus用户也可以理解,存储可能存在实际限制。真正的问题是如何管理旧记忆一旦达到限制。当前的内存管理界面是繁琐和耗时的。当ChatGPT通知您内存已满100%时,您有两个选项:一个一个地删除记忆,或者一次性删除所有记忆。没有中间选项或批量选择工具来高效地修剪存储的信息。
一个一个地删除记忆,特别是如果您需要每隔几天这样做,感觉像是一项不利于长期使用的任务。毕竟,大多数保存的记忆都是有原因的——它们包含了您提供给ChatGPT的关于您的需求或业务的有价值的上下文。自然,您更愿意删除最少数量的项目以释放空间,这样您就不会阻碍AI对您历史的理解。然而,内存管理的设计强迫采用一种非此即彼的方法或缓慢的手动策划。我个人观察到,每个删除的记忆只释放大约1%的内存空间,表明系统只允许大约100个记忆,然后就会满(100%使用)。这个硬性限制在现代AI系统的规模下感觉是武断的,并且破坏了ChatGPT成为一种能够随着时间增长的知识助手的承诺。
应该发生的事情
考虑到ChatGPT和其背后的基础设施可以访问几乎无限的计算资源,长期内存的解决方案如此原始是令人惊讶的。理想情况下,长期AI记忆应该更好地复制人类大脑的运作方式和随时间处理信息的方式。人类大脑已经演化出高效的策略来管理记忆——我们不只是逐字记录每个事件并无限期地存储它。相反,大脑的设计是为了效率:我们在短期内保留详细的信息,然后逐渐整合和压缩这些细节到长期记忆中。
在神经科学中,记忆整合指的是不稳定的短期记忆转化为稳定、长期的记忆的过程。根据整合的标准模型,新的经历最初由海马体编码,海马体是形成情景记忆的关键区域,随着时间的推移,知识被“训练”到皮层中进行永久存储。这个过程不是瞬间发生的——它需要时间的推移,通常发生在休息或睡眠期间。海马体本质上充当快速学习缓冲区,而皮层逐渐将信息整合到更耐用的形式中,分布在广泛的神经网络中。换句话说,大脑的“短期记忆”(工作记忆和最近的经历)被系统地转移和重新组织到分布式长期记忆存储中。这种多步骤转移使记忆更加抵抗干扰或遗忘,类似于稳定录音以免被轻易覆盖。
关键是,人类大脑不浪费资源来存储每个细节。相反,它倾向于过滤掉琐碎的细节,并保留最有意义的经历。心理学家长期以来一直注意到,当我们回忆过去的事件或学习信息时,我们通常记住了它的本质,而不是逐字逐句的记忆。例如,在读完一本书或看完一部电影后,您会记住主要的情节和主题,但不会记住每一句对话。随着时间的推移,事件的确切措辞和细节会渐渐消失,留下对发生了什么的更抽象的总结。事实上,研究表明,我们的逐字记忆(精确细节)比我们的本质记忆(一般意义)随着时间的推移而更快地消退。这是一种高效的知识存储方式:通过丢弃多余的细节,大脑“压缩”信息,保留最有可能在未来有用的基本部分。
这种神经压缩可以类比为计算机压缩文件,科学家已经在大脑中观察到了类似的过程。当我们在脑海中重现一段记忆或想象一个未来场景时,神经表示被有效地加速并去掉了一些细节——它是对真实经历的压缩版本。 德克萨斯大学奥斯汀分校的神经科学家发现了一种大脑波机制,允许我们在几秒钟内回忆一系列事件(例如,下午在杂货店度过的时间),使用一种更快的大脑节律来编码不太详细的、高层次信息。本质上,我们的大脑可以快速浏览记忆,保留大纲和关键点,同时省略丰富的细节,这些细节在重放时是不必要的或太笨重的。结果是,想象的计划和回忆的经历以压缩形式存储——仍然有用且可理解,但比原始经历节省了空间和时间。
人类记忆管理的另一个重要方面是优先级。并非所有进入短期记忆的东西都会被永远保存在长期存储中。我们的脑子会下意识地决定什么值得记住,什么不值得,基于重要性或情感意义。 最近在洛克菲勒大学的研究使用老鼠演示了这一原理:老鼠被暴露在迷宫中的一些结果(一些非常有回报,一些中等回报,一些负面)。最初,老鼠学会了所有的关联,但一个月后测试时,只有最显著的高回报记忆被保留,而不太重要的细节已经消失了。
换句话说,大脑过滤掉了噪音并保留了对动物目标最重要的记忆。研究人员甚至确定了一个大脑区域,前丘,它在整合期间充当海马体和皮层之间的调节器,发出信号,指示哪些记忆足够重要,应该“保存”以备长期使用。前丘似乎为有价值的记忆提供持续的强化——基本上告诉皮层“保留这个”,直到记忆被完全编码——同时允许不太重要的记忆消失。这一发现强调了忘记不仅仅是记忆的失败,而且是系统的主动功能:通过放弃琐碎或冗余的信息,大脑防止其记忆存储被混乱,并确保最有用的知识可以轻松访问。
重新思考AI记忆的原则
人类大脑处理记忆的方式为ChatGPT和类似的AI系统应该如何管理长期信息提供了一个明确的蓝图。与其将每个保存的记忆视为一个必须永久保存或手动删除的孤立数据点,AI可以在后台整合和总结旧记忆。例如,如果您有十个相关的对话或事实存储在您的正在进行的项目中,AI可能会自动将它们合并成一个简洁的摘要或一组关键结论——有效地压缩记忆,同时保留其本质,就像大脑将细节压缩成本质一样。这将在不真正“忘记”重要内容的情况下释放空间以存储新信息。确实,OpenAI的文档暗示,ChatGPT的模型已经可以执行一些自动更新和合并保存的细节,但当前的用户体验表明它还不够完善。
另一个受人类启发的改进是优先记忆保留。与其采用严格的100个项目限制,AI可以权衡哪些记忆对用户的需求或频率最相关或最关键,并且只丢弃(或降采样)那些最不重要的记忆。在实践中,这可能意味着ChatGPT确定某些事实(例如,您公司的核心目标、正在进行的项目规范、个人偏好)非常重要,应该始终保留,而来自几个月前的琐碎小知识可能会被归档或首先丢弃。这种动态方法与大脑持续修剪未使用的连接和加强经常使用的连接以优化认知效率相似。
关键是,AI的长期记忆系统应该演化,而不是简单地填满并停止。人类记忆非常适应性——它随着时间的推移转化和重新组织自己,并且不需要外部用户来微观管理每个记忆插槽。如果ChatGPT的记忆更像我们的记忆,用户就不会面临100个条目的突然障碍,也不会面临擦除所有内容或一个一个地点击100个项目的痛苦选择。相反,旧的聊天记忆会逐渐变成一个提取的知识库,AI可以从中获取信息,只有真正过时或不相关的部分才会消失。AI社区(这是目标受众)可以欣赏到,实施这样的系统可能涉及上下文总结、用于知识检索的矢量数据库或神经网络中的分层记忆层等技术——所有这些都是活跃的研究领域。事实上,给AI一种“情景记忆”,它会随着时间的推移而压缩,这是一个众所周知的挑战,解决它将是朝着AI持续学习和可持续扩展其知识库迈出的一大步。
结论
ChatGPT当前的记忆限制感觉像是一个临时解决方案,它没有利用AI的全部潜力。通过研究人类认知,我们发现,有效的长期记忆不仅仅是存储无限的原始数据——它是关于智能压缩、整合和遗忘正确的东西。人类大脑保留重要信息同时节省存储空间的能力,正是使我们的长期记忆如此庞大和有用的原因。为了成为真正的长期合作伙伴,AI应该采用类似的策略:自动将过去的互动提炼成持久的见解,而不是将这个负担转嫁给用户。遇到“内存满”墙的沮丧可以被一个能够随着使用而优雅增长、以灵活、类似人类的方式学习和记忆的系统所取代。采用这些原则不仅可以解决用户体验的痛点,还可以为依赖这些工具的整个用户和开发者社区解锁更强大、更个性化的AI体验。












