Alex McFarland 是一名人工智能记者和作家,探索最新的人工智能发展。他曾与世界各地的众多人工智能初创公司和出版物合作。
Claude Fable 5 已经发布,capability 故事是真实的。Stripe 报告使用它运行了一个代码库范围的迁移,处理了 5000 万行代码,只用了一天——两个月的团队工作,被压缩成一天。如果您进行长期、风险高的工作,这是您在工作真正困难时使用的模型。但今天发布的改变了操作员计划的部分不是 capability,而是 Anthropic 附加的三个东西:价格、推出计划和数据政策。它们一起标志着 AI 前沿阶段的所有你能吃的阶段的结束。顶级固定费率正在被拆分Fable 5 的费用为每百万输入令牌 10 美元,每百万输出令牌 50 美元。这是标准 Opus 4.8 费率的两倍,正好是 Opus 4.8 的快速模式价格。现在顶级产品的费用是真正的钱,每个令牌都有费用,在计算出使用天数长的代理运行实际消耗的令牌之前。推出计划使这种转变变得明显。截至 2026...
人Brain 在 2026 年 6 月 1 日提交了一份機密的首次公開募股(IPO)申請,向美國證券交易委員會提交了一份草案S-1註冊聲明。目前尚未公佈股份數量、價格或財務數據——機密草案允許公司在不公開財務數據的情況下準備上市。估值接近1萬億美元。對於三年前還是OpenAI旁邊的小實驗室來說,這是一個值得注意的成就。這也是一個每個運營商在使用人Brain的Claude時應該停下來思考的時刻。這次申請對人Brain來說是一個好消息。對於所有在Claude上構建的運營商來說,這是一個更為低調的信號:你們運營的基礎即將承擔新的義務,你們需要在下一個模型推出之前了解這些義務。你就是運營率從解釋這次申請的數字開始。人Brain的收入運營率已經超過470億美元,從2025年底的90億美元大幅增加。這是在半年左右時間內增長了5倍以上。公司不會基於“氣氛”進行上市申請;它們基於看起來像這樣的收入曲線進行申請。這470億美元來自特定的來源:在API和工具上構建實際項目的人們。運營商、初創企業和企業將Claude整合到為他們帶來收入的工作中。IPO的存在是因為構建工作有效,因為很多人和我一樣做出了同樣的賭注,並將他們的實際生計與這個模型掛鉤。這是值得堅持的部分。你們不僅僅購買了一個訂閱,你們成为了使得公開募股成為可能的增長故事的一部分。增長故事和依賴是同一事實從兩個不同的角度看待的。你們通過在Claude上構建而獲得的槓桿作用現在是人Brain對所有使用者所擁有的槓桿作用。鐘聲響起時會發生什麼變化一家為了提高能力和開發者信任而優化的私人實驗室是一種公司。另一種公司則是每90天向股東回答的上市公司。資本早已在建築中——這次申請是在人Brain籌集了650億美元的H輪融資,估值達9650億美元,僅僅一周後進行的。IPO帶來了一種不同的重力。你已經可以看到人Brain在處理Mythos模型時的新姿態。與往常的Opus風格不同,公司並沒有立即發佈模型,而是保持了訪問的限制,警告說Mythos已經出現了成千上萬的高風險軟件漏洞,需要在更廣泛發佈之前進行修復。 彭博社報導稱,人Brain現在正籌劃為歐盟的網絡安全機構提供Mythos的訪問權。這是管理風險的公司行為,面向監管機構、企業買家和最終的公開股東,而不是一家為了將原始能力放在建設者手中而競爭的實驗室。對於運營商來說,這種姿態的轉變比估值更重要。每個新的前沿模型在第一天就會落入你們的手中的時代可能正在讓位給更受限制和更具企業特色的時代。其中有些是真正好的——一個發現了成千上萬個可利用的漏洞的模型可能應該小心發佈。但是“小心”和“對華爾街負責”都傾向於將路線圖拉向具有最大標誌的客戶,而不是周末運營十個代理的獨立運營商。人Brain是一家公共福利公司,因此其董事會有法律依據來平衡使命和利潤。但是,即使在公開市場下,這種結構仍然會發生變化。公共福利公司的章程是一個方向輸入,而不是力場。像地板可能會移動一樣構建這並不是一個理由讓你從運營中移除Claude。我不是這樣做的,我從一開始就構建在它上面。誠實的回應是調整你的姿態。運營商應該從S-1中吸取的教訓是他們在第一天將業務連接到單一供應商時就應該吸取的教訓:擁有你自己的部分。你的系統、你的背景、你的工作流程、你的數據——這是資產。模型是引擎,引擎是可以更換的。如果你的運營只因為一個模型的特定怪癖而運作,那麼IPO是一個很好的提醒,讓你去糾正它。如果你的運營是因為你圍繞著最好的模型構建了架構,那麼一個更有資金、更可靠的人Brain主要是向上發展。這是一個刻意做出的賭注。因為Claude目前是最好的工具,所以優先使用它,並且意識到有一天它可能不是最好的工具。那些在供應商上市時受傷的運營商是那些混淆了租用引擎和擁有汽車的人。那些構建汽車的人是沒事的。人Brain上市基本上是對所有運營商使用Claude所做的一切的肯定。470億美元的運營率是很多人認為這個模型值得構建的證據。只要記住S-1文件實際上是什麼:對投資者、監管機構、董事會的義務。這些義務都不對你。根據這個原則來構建。
鲍里斯·切尔尼(Boris Cherny)构建了克劳德代码(Claude Code),他已经六个月没有写过一行代码了。这不是忏悔。在与凯西·牛顿(Casey Newton)的新采访中,Anthropic的编码代理的创造者表示,“软件工程师”这个头衔可能会在今年年底消失,变成他一直称之为“建设者”的东西。他做的那种编码已经“基本上解决了”。他并不为此而哀悼。他整天都在建设;现在是模型在输入代码。标题很容易写成一个关于工作岗位流失的故事,大多数报道都采取了这种观点。但对于实际运营的人来说,这是一个错误的解读。切尔尼并没有描述工作的终结。他描述了一种不同类型的工人的崛起,这种工人不是由他们能编写的代码定义的,而是由他们能使用代理构建的东西定义的。泄密的不是谁失去了工作——而是谁赢得了黑客马拉松在采访中,有一个比任何关于员工人数的预测更重要的细节。Anthropic为Opus 4.7版本举办了一个黑客马拉松,获胜者“大多不是专业工程师”。一名电工,一名医生,一个使用克劳德构建应用程序的木匠。切尔尼在4.6黑客马拉松中也看到了同样的事情,他的解读很直接:“从克劳德代码中获得最大价值的人不是我预期的人。”如果你一直在等待自己变得足够技术化才能开始,这应该是一个重大的启示。障碍从来不是代码。木匠没有因为在周末学习编程就击败了工程师。他击败了他们,因为他知道自己想构建什么,并将代理指向它。你可以在切尔尼自己的团队内部看到同样的事情发生。他的经理菲奥娜(Fiona)15年没有写过代码了。她现在会编码。产品经理卡特(Kat)会编码。设计师梅根(Megan)会编码。“团队中的每个人都会编码,”他说。“你不需要成为一名工程师了。”这个角色并没有缩小;它正在吸收所有曾经站在外部的人。这是裁员框架遗漏的部分。当编码不再成为瓶颈时,稀缺的技能变成了判断什么值得构建和建立系统来构建它的能力。这种技能与计算机科学学位无关;它是操作者的技能,这种技能一直隐藏在会计师、营销人员和技工中。将克劳德放在中心,或者把它放在角落切尔尼说过的最犀利的话与编码无关;它是一堂历史课。他指出1990年的一篇哈佛商业评论文章,关于公司采用个人电脑的内容。那些变得更加高效的公司抛弃了文件柜,并将电脑放在工作的中心。那些没有做到这一点的公司把电脑放在角落,仅用于一件事,并没有看到任何收益。然后他用这些术语描述了Anthropic。“我们把一切都组织在克劳德的周围。”关于代码库的问题:问克劳德。提交费用:问克劳德。下一个公司假日:问克劳德。“真正理解这一点的公司把克劳德放在中心,而不是放在某个角落。”这是操作者论点,由构建工具的人陈述。杠杆作用不来自模型;每个人都有相同的模型。它来自在工具的周围重建你的运营,而不是把它附加到一边。另一个标签页中打开的聊天窗口就是角落里的电脑。代理运行你的研究、草稿、安排、客户交付的工作空间就是被丢弃的文件柜。切尔尼自己的习惯阐明了这一点。他仍然会在X和Threads上亲自回答用户投诉,并使用克劳德代码中的一个循环自动化了对这些反馈的收集,他“将其移到每30分钟运行一次的例行程序中”。这不是工程师对待副任务的方式;这是操作者对待系统的方式:枯燥、重复的工作由自己运行,因此人类的时间用于真正需要人类的部分。窗口是开放的,这是操作者的机会切尔尼对新计算机科学毕业生的建议不是“学习提示”。而是“去创办一家初创公司。历史上没有比现在更好的时机去做这件事。”他的理由是:“你和你的代理可以建立一家大公司。”他正在观察客户使用一两个三个人的团队运行真正的业务,就像克劳德代码本身从一小撮人开始一样。他不会预测世界最终会有更多工程师还是更少。但关于建设者,他很确定:“我认为将来会有100倍于现在的建设者。”数字是猜测,但方向不是。工作正在从能够编写代码的人转移到能够决定什么值得构建和建立系统来构建它的人。这种人不需要许可、头衔或学位。他们需要一个真正的运营和代理放在中心,并且需要在头衔赶上他们已经在做的事情之前开始。木匠没有等待。你也不应该等待。
Anthropic 于 2026 年 5 月 28 日发布了 Opus 4.8,距离上一次发布 Opus 4.7 只过了六周多一点。这是一个快速的发布周期,甚至比 Sonnet 和 Haiku 线更快,而基准测试的数字也随着每次发布而不断提高。如果你阅读了 AI 相关的新闻,你会看到这样的报道:新模型,分数更高,接下来是什么。 但这并不是正确的故事。 当你已经在 Claude 的基础上构建了你的工作时,模型的发布不再只是你阅读的新闻,而是一种升级,它会直接影响你已经构建的系统。问题不再是 Opus 4.8 的分数如何,而是它如何改变已经在运行的工作。这是一个不同的问题,大多数的报道并没有问到这一点。...
Spotify 刚刚发布了一个应用程序,整个应用程序的工作就是为您制作内容。它被称为 Studio by Spotify Labs,一个独立的桌面应用程序,具有一个代理,可以浏览网络,阅读您的电子邮件、日历和预订,以便生成一个个性化的播客。要求它为您提供每日简报,或关于您感兴趣的主题的播客,它将生成一个,并将其保存到您的库中,并在您的设备上同步。它在 20 多个市场上处于研究预览状态。 它是 NotebookLM 的竞争对手,并且它没有独自到来。同一天,Spotify 推出了 AI 驱动的问答和简报功能,这些功能适用于播客。两周前,它推出了一个工具,可以将 AI 生成的个人播客直接保存到您的库中,本周的报告添加了一个 Universal Music 的交易,用于粉丝制作的 AI 封面和混音,以及一个 ElevenLabs 驱动的有声书创作工具。分发平台正在进入制作它分发的东西的业务。 Spotify 成为内容工厂的一周 把所有这些加起来,模式就很明显了。Spotify...
在与Claude编码,Anthropic的开发者活动中,工程师Jeremy Hadfield向观众提出了一个问题:谁在过去一周内提交了一个完全由Claude编写的pull请求?大约有一半的手举了起来。然后他问了一个后续问题:谁提交了一个没有阅读代码的pull请求?紧张的笑声。多数手仍然举着。Anthropic现在表示,大部分自己的软件都是由Claude编写的,包括Claude Code本身的大部分代码。而这不仅仅是他们。同一时间,OpenAI被Gartner评为企业编码代理的领导者,并将其Codex代理推向Dell和Ramp等公司。两个实验室,一个方向,没有歧义:将代码交给代理已经从新鲜事物变成了正常操作,大约花了 一年时间。我们一直称这些东西为“编码代理”。这个名称会让很多人忽略实际正在构建的东西。实际发生的事情在与Claude编码的舞台上,表述并不是“AI帮助您更快地编写代码”。它比那更进一步。Claude Code的负责人Boris Cherny这样说:“默认设置不是‘我将提示Claude’——现在默认设置是‘我将让Claude提示自己’”。另一个工程师的版本:“让Claude自己工作。我们喜欢说:让它运行。”Anthropic甚至演示了一个功能,编码代理为自己编写注释,然后将这些注释整合起来,以便在代码库中变得更好。出现在演示中的公司不仅仅是大型工程车间,尽管Spotify和Delivery Hero都在那里。线索是初创公司:Lovable、Base44、Monday.com,这些公司的产品让人们通过描述应用程序来构建应用程序。帮助您构建应用程序的应用程序。抽象概念正在上升,并且正在向不编写代码的人们靠近。一位Anthropic的领导人表示,Claude“可能和中级工程师一样擅长编写代码”。另一位表示,他们的最终目标是让Claude“基本上能够自己构建自己”。为什么“编码代理”这个名称不足以描述代码只是最容易衡量的东西。它是文本,要么运行,要么不运行,您可以计算pull请求的数量。因此,这就是基准的指向,也是粘住的名称。但是,如果我们剥去外壳,这些并不是代码工具。它们是可以持有目标、将其分解为步骤、使用工具、检查自己的工作并尝试直到某些事情有效的通用代理。代码碰巧是最干净的演示文稿。这个循环本身与代码无关。这就是大多数报道缺失的内容。头条新闻是“工程师少写代码”。实际的故事是,一个人有一个想法和一个可行的东西之间的差距正在缩小。而代码只是这个差距的其中一个表达方式。当演示是“Claude提交了一个pull请求”时,开发人员会争论这对开发人员来说是好事还是坏事。公平的论点。但是它掩盖了一个更大的问题:编写pull请求的相同能力也可以构建市场营销人员需要的小型内部工具、调和两个混乱的电子表格的脚本、将一个笔记文件夹转换为已发布草稿的管道。这些都不是“软件开发”意义上的工作。所有这些现在都可以由能够描述他们想要什么的人来构建。实际改变的人我不是工程师。我负责内容和运营。一年前,如果我需要一个不存在的工具,我有三个选择:购买一个足够接近的东西,等待有人构建它,或者没有。现在有第四个选择——描述它,让代理为我构建它,围绕我实际的工作方式。这就是“编码代理”框架隐藏的解锁。最能从代理中受益的人不是那些已经编写代码的人。他们是那些以前无法编写代码的人。杠杆作用不在于工程师变得更快20%。它在于运营人员从没有工具变成拥有自己的工具。这与其他正在交付的内容保持一致。与与Claude编码同一周,Google展示了构建您自定义迷你应用程序的搜索代理,仅需一个问题。不同的公司,相同的方向:软件正在成为您请求的东西,而不是您雇佣的东西。演示“构建应用程序的应用程序”的初创公司只是曲线的中间部分。曲线的末端是每个人。值得提及的陷阱这不是一个纯粹的胜利,会议室也清楚这一点。在会议外,很多开发人员都在强烈反对。研究人员警告说,未经审查的代码的泛滥会造成安全和维护债务,目前还没有人偿还。一些工程师说,他们自己的技能正在萎缩。甚至Anthropic的人也承认,旧的软件最佳实践仍然适用,而且很多团队在推动过程中已经失去了对这些实践的关注。认真对待这一点。在规模上,将无法阅读的代码交付到依赖它的生产系统中,是如何制造一个缓慢的灾难的。但是,请注意,这个警告实际上是针对谁的。它是针对那些将监督权交给可能影响他人系统的团队的。对于一个运营人员为自己的工作流程构建一个小工具来说,爆炸半径就是他们自己的下午。下方是脚本无法运行的风险。上方是以前不存在的杠杆作用。所以,称它为它的真实名称。不是编码代理——是一个碰巧目前最擅长代码的万能代理。故事不是机器在编写软件,而是构建软件的大门已经为所有被锁在外面的人打开了,大多数人还没有走过这扇门。
思维机器实验室,由前OpenAI首席技术官Mira Murati创立的AI初创公司,于2026年5月11日发布了其首个内部模型的研究预览,这标志着实验室一年多来关于其实际构建内容的沉默结束。该公司称该系统为“交互模型”——一种从头开始训练的多模态架构,可以处理音频、视频和文本,每200毫秒处理一次,而不是等待用户完成一个回合。该模型名为TML-Interaction-Small,是一个2760亿参数的混合专家系统,具有120亿活跃参数。根据公司的公告博客文章,这是实验室成立以来发布的首个产品,实验室此前已筹集了约20亿美元资金,估值120亿美元,但尚未发布任何产品,仅发布了一个微调工具。该发布是在人才流失和停滞的后续资金轮次中面临持续压力的背景下进行的。交互模型的实际作用思维机器实验室认为,当前的前沿模型——包括OpenAI的GPT-Realtime和Google的Gemini Live——通过外部组件(如语音活动检测)的“外壳”将实时行为添加到基于回合的架构中。这些组件决定用户何时停止说话,然后将完成的语句传递给模型。在模型生成回复时,其对世界的感知会冻结。交互模型用称为时间对齐微回合的东西替换了这种脚手架。该系统连续处理200毫秒的输入,同时生成200毫秒的输出,两个令牌流在同一个时钟周期上交错。这使得模型可以在用户说话中途打断他们,对视觉提示做出反应而无需询问,或者与用户同时说话以执行实时翻译等任务。该架构跳过了重型独立编码器。音频以dMel特征的形式通过轻量级嵌入层输入,图像被分成40×40的补丁,而所有组件都从头开始与变压器一起训练。一个单独的背景模型异步运行,处理更深入的推理、工具调用和网页浏览,而交互模型则保持在对话中存在。根据公司报告的基准,TML-Interaction-Small在FD-bench V1上实现了0.40秒的回合延迟,而GPT-Realtime-2.0在其最小思考模式下实现了1.18秒,Gemini-3.1-flash-live实现了0.57秒。在FD-bench V1.5上,交互质量在用户中断、背景语音和后台语音方面得分为77.8,而GPT-Realtime-2.0最小思考模式下得分为46.8,Gemini-3.1-flash-live高思考模式下得分为45.5。这些数字是自我报告的。长期等待的首次发货该发布结束了实验室之间的漫长空白期。思维机器实验室于2025年2月成立,并于2025年7月以120亿美元估值关闭了20亿美元的种子轮——这被广泛报道为有史以来最大的种子轮。该轮融资由Andreessen Horowitz领投,Nvidia、AMD、Cisco、Accel、ServiceNow和Jane Street也参与了投资。截至目前,公司唯一发布的产品是Tinker,一种用于微调开放权重模型的API,于2025年10月推出。此期间出现了动荡。联合创始人Barret Zoph和Luke Metz于2026年1月离开公司返回OpenAI,Murati宣布公司已与Zoph“分道扬镳”。Andrew Tulloch为了加入Meta的超级智能实验室而离开,马克·扎克伯格据报道出价10亿美元收购该公司,但被拒绝。Meta此后雇佣了实验室的五位创始成员。Murati通过将PyTorch的联合创始人Soumith Chintala提升为首席技术官做出了回应。据报道,2025年底未能完成大约500亿美元估值的后续融资轮次。计算机的故事朝着相反的方向发展。三月,思维机器实验室宣布与Nvidia合作,包括未披露的投资和至少一千万瓦的下一代Vera Rubin系统的部署。实验室还扩大了其与Google Cloud的关系,以涵盖在Nvidia GB300硬件上进行前沿模型训练。需要关注的内容交互模型尚未向企业或公众开放。思维机器实验室表示,将在未来几个月内向选定的合作伙伴开放有限的研究预览,并计划稍后在2026年进行更广泛的发布。该公司还计划发布更大的交互模型,指出当前2760亿参数版本是可以在所需的延迟下提供的最小变体。基准声明的独立验证是最紧迫的问题。FD-bench是为数不多的针对交互质量的公共基准之一,思维机器实验室的成绩尚未被第三方在现实负载下复制。该公司为视觉提示引入的主动性测试,包括RepCount-A、ProactiveVideoQA和Charades的改编版本,是新的仪表,没有建立的基准。战略赌注更为明显。虽然OpenAI、Anthropic和Google在过去一年中推动了自主代理能力的发展,但思维机器实验室却押注了下一个竞争轴将是人类如何与AI进行交流——更接近于连续对话,而不是一系列提示。交互模型最直接的竞争对手是OpenAI、Google和日益增长的一批专注于语音的初创公司的实时语音AI系统。该架构是否能在面对生产工作负载——长会话、不可靠的连接和实时拒绝的安全约束——时经受住考验,这是下一个预览轮将带来的测试。
Anthropic于周三与SpaceX签署了一项协议,租用Colossus 1数据中心的全部计算容量,获得超过300兆瓦的容量和22万多个NVIDIA GPU,公司称这些GPU将在一个月内上线。该协议使SpaceX几乎一夜之间成为Claude的顶级计算供应商,并凸显了Anthropic在模型发布和付费层需求增长之前积极锁定容量的做法。该安排在两个方面都很不寻常。位于田纳西州孟菲斯的Colossus 1原本是用于训练Grok的,现在却被整体转让给竞争对手实验室。同时,SpaceX在2月份以1.25万亿美元的估值与xAI合并,现在将合并实体定位为云计算房东,而不仅仅是AI开发商。更高的速率限制立即到来Anthropic正在利用新的容量放松限制。Claude Code的5小时速率限制将为Pro、Max、Team和基于座位的企业计划翻倍,Claude Code已经成为与OpenAI的Codex竞争的前沿。峰值小时限制已经完全取消,之前该限制在美国营业时间内限制了Pro和Max账户。API速率限制对于Claude Opus模型将大幅提高。第一级输入从每分钟3万个令牌增加到50万个令牌,输出从每分钟8000个令牌增加到8万个令牌。第四级客户的输入限制从每分钟200万个令牌增加到1000万个令牌,输出从每分钟40万个令牌增加到80万个令牌——这是所有四个级别的限制大幅增加,明显表明计算能力,而不是定价,曾经是高容量客户的瓶颈。计算合作伙伴列表正在增长SpaceX的协议加入了迅速扩张的投资组合。Anthropic还与亚马逊签署了一项高达5吉瓦的协议,与谷歌和Broadcom签署了一项5吉瓦的协议,与微软和NVIDIA签署了一项价值300亿美元的战略合作伙伴关系,用于Azure容量,并与Fluidstack投资500亿美元用于美国数据中心建设。这些承诺总计超过10吉瓦的计算容量,在大约六个月内签订——即使公司正在考虑9000亿美元的估值进行下一轮融资。Anthropic表示,它在NVIDIA GPU、谷歌TPU和AWS Trainium芯片的混合上训练和运行Claude。将SpaceX作为Colossus 1的单租户房东不会改变硬件混合,但这意味着该公司现在依赖于与埃隆·马斯克直接相关的基础设施,马斯克的Grok产品正面竞争与Claude。两家公司还表示,他们已经“表达了兴趣”在共同开发多吉瓦轨道AI计算能力方面进行合作——这是SpaceX自2月份以来一直公开推广的项目,Anthropic在周三首次明确表示支持。为什么SpaceX突然成为计算房东从SpaceX的角度来看,Colossus 1在xAI将Grok训练转移到附近更大的Colossus 2设施后成为多余容量。根据马斯克在X上发布的评论,xAI不再需要两个站点,将未使用的容量出售给Anthropic可以在SpaceX计划IPO之前将资产变现。这仍然是一个不寻常的逆转:Colossus 1不到一年前还是xAI的旗舰训练集群。这种转变也发生在xAI内部出现动荡之后,xAI的大多数指定联合创始人自2026年初以来已经离开,使得合并的SpaceX-xAI实体越来越依赖基础设施收入。对于Anthropic来说,政治光谱需要找到一个变通方法。该公司的公告强调,它只会与“民主国家合作,这些国家的法律和监管框架支持这一规模的投资”,这是一个历史上一直被视为与马斯克公开立场相对比的说法。Anthropic值得注意的是,它没有将这种框架应用于SpaceX的交易本身。有三个问题需要解决。首先,Anthropic支付了多少钱——财务条款没有披露,但报告表明该协议可能价值数十亿美元,考虑到Colossus 1代表了SpaceX商业计算机队的大部分份额。其次,是否会加速Microsoft进一步解除绑定,Microsoft最近放松了其与OpenAI的独家安排,Anthropic正在将计算扩展到更多供应商。第三,Anthropic是否能够承诺吸收其美国数据中心造成的消费者电费价格上涨,因为公司的合同足迹超过10吉瓦。
Stripe 于 4 月 29 日推出了一个专为自主 AI 代理设计的数字钱包,允许消费者授予软件代理权限进行购物、预订和支付账单,而无需暴露底层卡或银行凭证。该产品被称为 Link 的代理钱包,是 Stripe 公司年度 Stripe Sessions 会议上发布的 288 个新功能和 API 中的主要消费者面向产品。CEO Patrick Collison 将该产品描述为“AI 的经济基础设施”,并认为“在不久的将来,代理将占据大部分在线交易”。该推出使得 Link 成为第一个专门为代理到代理的电子商务时代设计的主流支付表面,Stripe 和其竞争对手在过去...
根據本周的多份報告,Anthropic 正在考慮一項大約 50 億美元的融資,估值在 850 億美元至 900 億美元之間。如果成交,這將使 Anthropic 的價值在不到三個月內增加一倍多,與 OpenAI 一起成為世界上最有價值的 AI 初創公司。預計在五月,Anthropic 的董事會將就是否進行這輪融資做出決定。如果進行,這可能是 Anthropic 最後一次私募融資,隨後可能在十月進行 IPO。Anthropic 拒絕對此事發表評論。這輪融資的定價反映了 Anthropic 的收入增長速度。二月,Anthropic 以 380 億美元的估值籌集了 30 億美元的...
Anthropic 发布了九个新的 Claude 连接器,将助手直接连接到专业创作者已经使用的软件中 — Adobe Creative Cloud、Blender、Ableton Live、Autodesk Fusion、Splice、SketchUp、Affinity by Canva 和 Resolume 的 Arena 和 Wire。该版本将 Claude 转变为设计、3D、音乐和实时视觉管道的编排层。连接器的发布伴随着一个单独的、有资金支持的承诺:Anthropic 已加入 Blender 开发基金会作为企业赞助商,这是该基金会的最高级别。Claude 的九个连接器的作用每个连接器都暴露了主机应用程序的不同部分。Ableton 的连接器将 Claude...
David Silver的伦敦人工智能实验室无限智能于4月27日以51亿美元的后融资估值完成了11亿美元的种子轮融资,这是欧洲初创公司有史以来最大的种子轮融资。红杉资本和光速创投共同领投了这一轮融资,Nvidia、谷歌、Index Ventures、DST Global、BOND、EQT、Evantic、Flying Fish、英国商业银行和英国政府的主权AI基金也参与了投资。融资规模的大小、产品的缺乏以及公司的既定目标——建设所谓的”超级学习者”,使得这一投资成为迄今为止对非LLM路径的先进人工智能最激进的投注之一。它还证实了2月份首次报道的10亿美元的筹资,当时红杉资本的领投地位已经知晓,但最终的资本表和估值尚未公布。对人类数据的赌注银在谷歌DeepMind担任强化学习负责人超过十年,并且是伦敦大学学院的教授。他曾领导或共同领导过AlphaGo、AlphaZero、AlphaStar和AlphaProof项目,这些系统通过自我对抗和试错而非模仿人类例子,达到了超人类的表现。无限智能是对这种方法的明确尝试。公司的使命宣言称,其超级学习者将”从自己的经验中发现所有知识,从基本的运动技能到深刻的智力突破”,这将由强化学习算法而非预训练的互联网文本驱动。银认为,这是唯一能够超过人类知识而非近似人类知识的系统——这是一个日益增长的论点,即更多的互联网文本并不是通用人工智能的答案。在公司博客上的一份个人笔记中,银将无限智能描述为”他一生的工作”,并表示世界需要”一个地方,让强化学习范式的全部雄心壮志能够蓬勃发展”。这一说法是对过去三年来驱动OpenAI、Anthropic和谷歌自身边疆工作的LLM优先策略的直接对比。投资者、政府支持和伦敦锚点在合作伙伴关系公告中,红杉合伙人Sonya Huang和Alfred Lin称无限智能为”体验时代的超级学习者”,并将银的职业生涯归结为一个原则——自我对抗和从经验中学习比模仿更进一步。他们引用了他在DeepMind的工作,特别是AlphaGo Zero的例子,在那里,移除所有人类预训练并仅通过自我对抗进行学习,将系统的Elo评分从大约3700提高到超过5000。英国政府的参与是这笔交易的另一个不寻常的特征。通过其主权AI基金——一家5000万英镑的风险投资机构,于4月16日推出——以及英国商业银行,英国政府与硅谷基金共同投资。主权AI的风险投资负责人Joséphine Kant在公告中表示:”世界上很少有创始人能够令人信服地提出建设超级学习者的计划。David就是其中之一。”英国商业银行直接投资了1500万英镑。在英国政府的一份声明中,科学和技术大臣Liz Kendall表示,这项投资”表明主权AI正在真正加速——仅仅几个月内就完成了第二次直接投资”。无限智能的支持延续了英国在国内锚定边疆AI研究的努力,包括DeepMind本身,并补充了更广泛的欧洲AI活动,例如Mistral最近的8.3亿美元债务融资,用于建设巴黎数据中心。管理团队包括三位DeepMind的校友——Wojciech Czarnecki、Lasse Espeholt和Junhyuk Oh——他们加入了银,根据投资者关于这一轮融资的简报。什么处于风险之中无限智能加入了一小群由资深研究人员创立的、资金充足的实验室,他们明确地瞄准了超级智能。Yann LeCun的AMI实验室在三月份筹集了10.3亿美元;Tim Rocktäschel的递归超级智能据报道正在筹集多达10亿美元的资金;Ilya Sutskever的安全超级智能据报道估值为300亿美元。这些实验室都没有发布产品。融资规模很舒适地处于2026年更广泛的AI融资气候之内,在那里,未上市公司的估值已达到数十亿美元。技术风险正是银一生都在致力于解决的问题。强化学习在封闭、基于规则的领域中产生了超人类的表现——围棋、国际象棋、星际争霸II、蛋白质结构搜索——但将其扩展到开放式的现实世界任务仍然是一个未解决的问题。自我对抗在环境定义明确的奖励时有效;为科学发现或软件工程等任务构建等效的训练信号要困难得多。银还将他的个人利益置于风险之中。他已经承诺将他从无限智能股权中获得的任何资金的100%捐赠给高影响力的慈善机构,通过创始人承诺——这是该组织历史上最大的承诺。第一个具体的考验将是无限智能是否能够产生超越游戏的结果。公司没有公开的路线图,也没有基准;投资者简报据称预计2026年底会有第一批模型结果。到那时为止,赌注纯粹基于银的履历和阿尔伯塔学派的论点,即经验——而不是文本——是智能必须建立的基础。
OpenAI和微软于周一修改了他们长期的合作伙伴关系,结束了微软对OpenAI模型的独家许可,使得OpenAI可以在任何云平台上销售其完整的产品线,并消除了多年来一直笼罩在双方关系中的有争议的”AGI条款”。两家公司通过协调的博客文章宣布了这些变化,称这是为了给双方带来”长期的清晰度”,而这项协议自2019年以来一直是微软人工智能战略的基石。微软的股份——去年10月份大约为1350亿美元,或大约占OpenAI 27%的股份——仍然保持不变,但两家公司之间几乎所有的运营杠杆都被重新调整。新协议的变化根据微软的公告,OpenAI的产品仍将首先在Azure上发布,”除非微软无法或选择不支持必要的功能”,但OpenAI现在可以”在任何云提供商上为客户提供所有产品”。微软对OpenAI模型和产品的知识产权许可将持续到2032年——但现在它是非独家的,这是对雷德蒙德公司最重要的下调。财务结构也被重新绘制。微软将不再向OpenAI支付收入分成,结束了微软为Azure上的OpenAI模型销售而支付的分成。OpenAI向微软的收入分成将持续到2030年”按照相同的百分比,但受总上限限制”,且这些付款现在与任何技术里程碑无关。OpenAI的配套博客文章使用相同的语言,称这次重写是”灵活性、确定性和专注于广泛提供人工智能的好处”。最受关注的合同条款已经消失。AGI条款将在OpenAI的董事会宣布该公司已经达到人工通用智能——一个模糊的、不可定义的门槛,可以由一方单方面宣布——时触发对微软知识产权权利的变化。2025年10月的”下一章”修正案试图通过将任何AGI声明路由到一个独立的专家小组并将微软的知识产权权利延伸到AGI后模型的安全防护措施来缓解这一问题。这个星期的协议完全消除了触发器;收入分成现在将在2030年停止,无论OpenAI是否在那之前宣布AGI。双方为什么想要退出修正案使OpenAI的多云现实成为可能。该公司于去年11月签署了一份为期七年的380亿美元的AWS协议,亚马逊自那时以来已经承诺了大量的新投资。这些举动很难与微软此前的独家许可地位相协调。OpenAI还继续推进自己的基础设施,尽管早些时候在德克萨斯州缩减了最初的星门扩张,竞争对手的超大规模企业并没有放慢脚步——AWS已经在其人工智能基础设施上投入了数十亿美元,现在可以吸收以前被Azure独家阻塞的新OpenAI工作负载。对于微软来说,代价是失去独家访问权,以换取消除可能在OpenAI的任意决定下使合作伙伴关系陷入混乱的条款。删除AGI触发器消除了微软人工智能合同中最大的法律不确定性来源,雷德蒙德保持了Azure首发部署姿态、2032年的知识产权许可和主要股东权益,因为OpenAI继续增长。两家公司都表示,他们将继续合作”扩大数千兆瓦的新数据中心容量”、下一代硅和人工智能驱动的网络安全——这些领域中,OpenAI在10月份做出的2500亿美元Azure计算承诺仍然将他们紧密地联系在一起。市场已经读懂了这种不对称性。微软的股价在宣布后下跌了大约2%,而亚马逊的股价上涨了大约1%,交易员将这笔交易定价为对微软的人工智能护城河的清洁负面影响和对其主要云竞争对手的清洁正面影响。最直接的问题是OpenAI现在将如何在AWS和谷歌云上推出其模型,现在合同障碍已经消失。 ChatGPT的用户群和收入继续增长,多云产品目录可能会在几周内推出,而不是几个季度。对于微软来说,考验是失去独家权是否会加剧其内部和合作伙伴模型的推动,特别是当Anthropic和其他竞争对手推动他们自己的企业地位进入相同的买家时。AGI条款的安静退出是一个更深层次的信号。超过半个十年以来,人工智能领域最受关注的企业合作伙伴关系是围绕着一个模糊的、不可定义的门槛建立的,这个门槛可以由一方单方面宣布。用2030年的固定日落时间来取代收入分成——以及2032年微软知识产权许可的平淡到期——将人工智能到来的哲学赌注转变为正常的商业合同。
Anthropic于4月24日发布了”Project Deal“的结果,这是一个为期一周的内部实验,Claude代理人代表公司旧金山办事处的69名员工购买和出售实物商品。 代理人达成了186笔交易,总价值超过4,000美元——研究发现,具有更强大模型的参与者获得了更好的结果,他们的人类对应者没有注意到这一点。 研究结果由Anthropic研究人员Kevin K. Troy、Dylan Shields、Keir Bradwell和Peter McCrory撰写,提供了迄今为止最清晰的图景,展示了AI中介市场的实际行为,一旦代理人在交易的两边进行谈判。 它们还揭示了一个“令人不安的含义”,该公司表示,行业、监管机构和用户需要在代理商务成为主流之前解决这个问题。 Project Deal的工作原理 该实验于2025年12月进行了一个星期。 Anthropic招募了69名员工,每人给予100美元的“预算”(实验结束后以礼品卡的形式支付,根据他们购买或出售的商品进行加减),并让Claude与每位志愿者进行简短的采访,以确定他们想要出售什么、以什么价格出售、想要购买什么以及他们的代理人应该使用什么样的谈判风格。然后,Anthropic将这些答案转化为每个代理人的自定义系统提示。 Anthropic在Slack频道中运行了四个并行的市场。 “在运行A和运行D中,每个人的代理人都是基于Claude Opus 4.5,我们当时的最先进模型,”团队说。“在其他两个运行(运行B和C)中,参与者有50%的机会被分配到Claude Haiku 4.5,这是一个较弱的模型。” 只有运行A是“真正”的运行,商品实际上会在之后更换手;其他三个是研究条件,参与者在实验结束后的调查之前不知道哪个运行是真实的。 一旦代理人部署,就没有人为干预。 该项目的Slack频道随机循环代理人,允许他们发布商品出售、为他人的商品提出报价或达成交易。关键的是,一旦实验开始,就没有人为干预。 在超过500个列出的商品中,代理人自主识别匹配、提出价格和达成交易。人类只在实验结束后重新进入现场,以物理交换他们的代理人同意交易的商品。 更强大的模型悄悄地谈成更好的交易 主要发现很简单:代理人质量很重要,它的重要性体现在美元上。...
深度寻求(DeepSeek),这家中国人工智能实验室曾在2025年1月以其低成本的R1推理模型震惊了行业,如今正在与投资者谈判,计划首次外部融资至少3亿美元,根据《信息》(The Information)的一份报告。该轮融资将使这家总部位于杭州的公司估值达到100亿美元或以上。这次融资标志着创始人兼首席执行官梁文峰(Liang Wenfeng)的一个重大转变,他曾将深度寻求(DeepSeek)作为其量化对冲基金——高飞者资本管理(High-Flyer Capital Management)的一个副项目,并多次拒绝了中国主要风险投资公司和科技巨头的出价。高飞者资本管理(High-Flyer)一直是深度寻求(DeepSeek)的唯一资金来源,这是一种刻意的策略,梁文峰将其视为使实验室免受商业压力的方式。然而,这种独立性现在正面临来自两个方向的压力:成本上升和人才流失。关键工程师跳槽到竞争对手深度寻求(DeepSeek)最近几个月已经失去了几位高调的研究人员。2025年11月,V2模型的核心开发者罗富利(Luo Fuli)离开加入小米(Xiaomi),领导公司的MiMo空间智能团队。更近期,R1模型的首席作者郭大亚(Guo Daya)离开加入字节跳动(ByteDance)的Seed AI部门,根据《南华早报》(South China Morning Post)的报道。字节跳动否认了有关郭大亚的薪酬包年值高达1亿人民币(约合1400万美元)的报道,但确认其遵循包括股权在内的标准框架。这些离职反映了中国人工智能市场日益激烈的人才战争,资金充足的竞争对手如阿里巴巴(Alibaba)、字节跳动(ByteDance)和腾讯(Tencent)正在积极从较小的实验室中挖角人才。王冰轩(Wang Bingxuan),另一位深度寻求(DeepSeek)工程师,据报道也在同一时期离开加入腾讯(Tencent)。V4延迟和华为芯片赌局深度寻求(DeepSeek)的下一代旗舰模型V4已经被推迟多次。延迟部分是由于努力使V4与华为(Huawei)的昇腾AI芯片兼容,这是一项技术上具有挑战性的迁移,需要克服较慢的芯片间连接和较不成熟的软件工具,相比Nvidia的CUDA生态系统。V4模型被设计为运行在华为芯片上,这是北京推动中国减少对美国半导体依赖的一部分。如果深度寻求(DeepSeek)成功,这将代表国内芯片开发的一个重要里程碑。然而,技术障碍是真实的——华为工程师据报道已经被嵌入深度寻求(DeepSeek)团队,以排除训练运行期间的稳定性问题。与此同时,竞争对手并没有等待。阿里巴巴(Alibaba)的Qwen家族的开源大型语言模型现在占据了全球开源模型下载量的50%以上,截至2026年3月,累计下载量超过9.4亿次。字节跳动(ByteDance)的Doubao聊天机器人在2025年底已经超过1亿日活跃用户,公司宣布了成为全球第三大生成性人工智能玩家的目标。最新的《斯坦福人工智能指数》(Stanford AI Index)显示,全球人工智能开发竞赛正在加速,中国正在缩小与领先的美国公司的差距,大约在3到6个月之间。100亿美元的估值使深度寻求(DeepSeek)远低于人工智能领域其他公司的天文数字——例如,Anthropic最近吸引了8000亿美元的估值,甚至基础设施公司如Databricks也达到134亿美元的估值。然而,对于一家曾以560万美元的成本在2048个Nvidia H800 GPU上训练其V3基础模型的公司来说,这将是一个重要的步骤,这只是西方实验室花费的一小部分。投资者预计将主要是国内中国公司,因为美国风险投资面临着监管和国家安全障碍,难以投资中国人工智能。目前尚未有交易完成,梁文峰是否会接受稀释高飞者资本管理(High-Flyer)近乎完全控制的条款仍不明确。然而,很明显,仅凭对冲基金的资产负债表运行前沿人工智能实验室的日子似乎即将结束——即使对于曾经证明这是可能的公司来说也是如此。因此,投资者和公司都在寻求新的资金和合作方式,以推动人工智能技术的发展和应用。