Connect with us

思想领袖

人工智能的最新发展:OpenClaw 和自主智能

mm

开发人员今天所做的事情,我们所有人明天都会做。

2023 年,我对 ChatGPT 的发布并不感到意外。几乎所有 ChatGPT 能做的事情,早在 GPT-3 时代就已经有可能实现。人工智能开发人员理解这一点,但直到 ChatGPT 的出现,世界其他地方才意识到 GPT-3 的真正重要性。兴奋情绪来得有点晚。

类似的事情现在正在发生。

一个名为 OpenClaw 的项目已经风靡开发者社区,因为它可以在 自己的电脑 上运行。想象一下,如果 ChatGPT 可以访问所有文件 —— 可以读取、写入、运行命令,甚至启动应用程序。你可以说,“将此信息保存到新文件中”,或“查看该文件夹中的电子表格并将其纳入我正在编写的文档中”,甚至要求它直接运行软件。(在我的经验中,最后一部分仍然有一定的限制 —— 但正在迅速改进。)

Claude Code 几乎在一年前推出,具有相同的核心功能,但它被定位为编码工具 —— 基本上是 Cursor 的竞争对手。开发人员喜欢它。OpenClaw 做的事情是让世界其他地方一窥人工智能实际上 操作 电脑的含义,而不仅仅是与你一起思考。

在其核心,OpenClaw 是一个开源文件集,位于一个大型语言模型旁边,该模型已被授予在机器上运行命令的权限 —— 包括修改其自己的代码。OpenClaw 本身可能会成为一时流行,但它已经浮现出了一系列看似方向重要的问题。

最明显的变化是范式转变:可以 采取行动 的软件。它可以浏览、编辑文件、运行程序 —— 不仅仅是生成文本。这种单一的变化产生了两个令人惊讶的二阶效应。

首先,OpenClaw 挑战了数据库必须是下一代软件的第一类公民的假设。相反,它主要建立在人类可读的文件上。虽然它将学习整合到向量数据库中以实现长期记忆,但核心架构是基于文件的,而不是基于模式的。例如,其名称和目的存储在名为 Identity.md 的文件中,内容包括“氛围:随意和技术 – 接近但精确”和其“灵魂”存储在 Soul.md 中,内容包括“真正有帮助,而不是表演性地有帮助 – 跳过填充词,只要提供帮助;有意见 – 我可以不同意,喜欢,发现东西有趣或无聊 – 在要求帮助之前要有资源;尝试自己解决,然后如果卡住了再问”。

这最终是一个关于人工智能应用层的外观问题。值得注意的是,OpenClaw 涉及额外的模型训练或微调。这与一个可能的世界形成对比,在这个世界中,应用层将主要是微调的 LLM,训练在专有数据上。我的怀疑是两种方法都将共存 —— 但 OpenClaw 展示了一个有趣的路径。

第二,OpenClaw 强迫我们直接面对一个关键问题:软件是否应该被允许运行代码和自主编辑文件?

这位于功能性、隐私和控制的交叉点。如果人工智能系统要最大限度地发挥其作用,它们需要获得写入我们系统的权限。这需要信任。

OpenClaw 对信任问题的解决方案很简单:使一切开源。它不是说“我是一个黑盒,相信我”,而是说“这是所有代码。检查它。在本地运行它。占有它。”(话虽如此,人们已经这样做了,其当前的安全性似乎还不够)。

当我们思考未来的人工智能应用层时,OpenClaw 指向了一个有趣的方向,但它显然只是第一丝火花,在一场感觉像寒武纪大爆发的事件中。在 OpenClaw 发布的两周内,我们已经看到开发人员将其定制为特定工作(例如金融工作流),并开源这些适应性;通过 Moltbook 将多个代理连接在一起的实验;以及 Moltbook 启用代理“社交化”——作为副产品,允许代理讨论他们喜欢哪些工具,从而导致为代理本身构建工具。

如果我们相信开发人员今天所做的事情就是我们所有人明天都会做的事情,那么人工智能已经改变了软件的构建方式,通过三个核心原语:

  • 控制器 —— 像 Cursor 或 Claude Code 这样的 IDE,或者像 Claude Code 这样的命令行工具,提供了对模型的有意见、可定制的接口
  • 定制框架 —— 轻量级、纯文本的构件(通常是 README),它们编码了开发人员的思考和工作方式。模型在这些文件之间跳跃,如弹珠机:咨询设计指南、检查评估器和验证自己的输出
  • 可检查的模型 —— 生成输出的系统,开发人员可以验证。随着控制器和评估器的改进,开发人员需要越来越少地查看代码

我们仍然处于软件构建方式的重大转变的第一场。

这里也有一个负面方面。每个行业都正在经历“Napster 时刻”。软件开发碰巧是第一个,就像音乐是第一个被互联网颠覆的行业一样。其他行业也会跟随。但这不仅仅是一个分发的变化 —— 它是一个工作本身的变化。它看起来更像关系数据库的发明,而不是社交媒体的崛起。

但这里也有一个积极的方面 —— 这种转变远远超出了传统的 SaaS。这些系统非常适合个人的背景,很多人可能最终会拥有自己的定制软件。

你通常不会想到这样一个事实:创建一个 Instagram 账户会在数据库中创建一行,带有相关的 ID —— 但它确实如此。同样,使用这种新型软件,你可能会在生活中感受到它的影响,而没有意识到,你正在通过交互有效地编写代码 —— 或者代码正在代表你编写。

计算机科学中有一个格言:“不要重复自己。”如果你做某件事情超过一次,你应该编写一个函数。有了人工智能,我越来越发现,如果我甚至只想做某件事情一次,它通常足够简单,以至于可以自动化,所以它有意义,可以立即自动化。

在接下来的几天里,请注意你生活中有多少部分今天尚未被软件真正触及。我的信念是,这一新类别的工具将填补这些空白。

Matt Hartman 是 Factorial Capital 的创始人和管理合伙人,他利用自己的技术背景和深厚的技术创业者网络支持像 Modal、Factory AI 和 LanceDB 这样的公司,以及 Software Inc(被 OpenAI 收购)和其他站在技术前沿的初创公司。

在 Factorial 之前,Matt 在 Betaworks 度过了 8 年,在那里他们为 Huggingface(现估值 45 亿美元)、Anchor(被 Spotify 收购)和其他由编码创始人创立的公司写下了第一笔投资。成为风险投资家之前,Matt 是一名软件开发者和创业者——他在 CBRE 建立了技术平台,加入了 Hot Potato(被 Facebook 收购),并建立了一个成为 Apartments.com 一部分的房地产技术产品。

2023 年,Matt 推出了 Factorial Capital,并提出了新的投资论点:投资下一代 AI 初创公司需要深厚的技术理解,Factorial Capital 通过分布式技术创始人合伙人模式来执行,每个合伙人都与 Matt 合作寻找和支持新的投资。