Alex McFarland 是一名人工智能记者和作家,探索最新的人工智能发展。他曾与世界各地的众多人工智能初创公司和出版物合作。
思维机器实验室,由前OpenAI首席技术官Mira Murati创立的AI初创公司,于2026年5月11日发布了其首个自主研发模型的研究预览,这标志着实验室结束了长达一年多的沉默,终于揭晓了其真正的产品。该公司称这款系统为“交互模型”——一种从头开始训练的多模态架构,能够以200毫秒的块处理音频、视频和文本,而不是等待用户完成一个回合。该模型名为TML-Interaction-Small,是一种2760亿参数的混合专家系统,拥有120亿活跃参数。根据公司的公告博客文章,这是实验室成立以来首个产品,实验室此前已筹集了约20亿美元资金,估值120亿美元,但此前尚未发布任何产品,仅发布了Tinker,一种用于微调开放模型的API。该发布的到来正值实验室面临人才流失和停滞的后续融资轮次的压力之下。交互模型的真正作用思维机器实验室认为,当前的前沿模型(包括OpenAI的GPT-Realtime和Google的Gemini Live)通过外部组件(如语音活动检测)的“外壳”将实时行为添加到基于回合的架构中。这些组件决定用户何时停止说话,然后将完成的语句传递给模型。在模型生成回复的同时,其对世界的感知会冻结。交互模型用称为时间对齐微回合的东西取代了这种脚手架。该系统连续处理200毫秒的输入,同时生成200毫秒的输出,两者都在同一个时钟周期上交错。这一结构使得模型可以在用户说话中途打断,无需询问即可对视觉提示做出反应,或者与用户同时进行实时翻译等任务。该架构跳过了重型独立编码器。音频以dMel特征的形式通过轻量级嵌入层输入,图像被分成40×40的块,而所有组件都从头开始与变压器一起训练。一个单独的背景模型异步运行,处理更深入的推理、工具调用和网页浏览,而交互模型则保持在对话中存在。根据公司报告的基准,TML-Interaction-Small在FD-bench V1上的回合延迟为0.40秒,相比之下,GPT-Realtime-2.0在其最小思考模式下的延迟为1.18秒,Gemini-3.1-flash-live在其高思考模式下的延迟为0.57秒。在FD-bench V1.5上,交互质量在用户中断、背景语音和后台语音方面得分为77.8,而GPT-Realtime-2.0最小思考模式下的得分为46.8,Gemini-3.1-flash-live高思考模式下的得分为45.5。这些数字是自我报告的。长期期待的首次发布该发布结束了实验室产品发布的漫长等待。思维机器实验室成立于2025年2月,并于2025年7月以120亿美元估值完成了20亿美元的种子轮融资——据报道这是有史以来最大的一轮种子轮融资。该轮融资由Andreessen Horowitz领投,Nvidia、AMD、Cisco、Accel、ServiceNow和Jane Street等公司参与。直到现在,公司唯一发布的产品是Tinker,一种用于微调开放模型的API,于2025年10月推出。此期间,实验室经历了动荡。联合创始人Barret Zoph和Luke Metz于2026年1月离开实验室返回OpenAI,Murati宣布公司已与Zoph“分道扬镳”。Andrew Tulloch离开加入Meta的Superintelligence Labs,此前Mark Zuckerberg曾以10亿美元收购公司的报价被拒绝。Meta此后雇佣了实验室的五位创始成员。Murati通过将PyTorch的联合创始人Soumith Chintala晋升为首席技术官做出了回应。据报道,公司在2025年底之前未能以大约500亿美元估值完成后续融资轮。计算机的故事朝着相反的方向发展。三月,思维机器实验室宣布与Nvidia合作,涵盖未披露的投资和至少一吉瓦的下一代Vera Rubin系统的部署。实验室还扩大了其与Google Cloud的合作关系,以涵盖在Nvidia GB300硬件上进行前沿模型训练。关注点交互模型尚未向企业或公众开放。思维机器实验室表示,将在未来几个月内向选定的合作伙伴开放有限的研究预览,稍后将向更广泛的受众发布。该公司还计划发布更大的交互模型,指出当前2760亿参数版本是其可以在所需延迟下提供的最小版本。立即的疑问是对基准声明的独立验证。FD-bench是为数不多的针对交互质量的公共基准之一,思维机器实验室的成绩尚未被第三方在现实负载下复制。该公司为视觉提示引入的主动性测试,包括RepCount-A、ProactiveVideoQA和Charades的改编版本,是新的仪表,没有既定的基线。战略赌注更为明确。虽然OpenAI、Anthropic和Google在过去一年中推动了自主代理能力的发展,但思维机器实验室却押注下一个竞争轴将是人类如何与AI进行交流——更接近连续对话,而不是一系列提示。交互模型最直接的竞争对手是来自OpenAI、Google和日益增长的语音AI初创公司的实时语音AI系统。该架构是否能在面对生产工作负载时幸存——长时间会话、不可靠的连接和实时拒绝的安全约束——将是下一个预览轮将施加的测试。
人形智能公司于星期三与SpaceX签署了协议,租用Colossus 1数据中心的全部计算容量,获得超过300兆瓦的容量和超过220,000个NVIDIA GPU,公司表示这些将在一个月内上线。该协议使SpaceX几乎一夜之间成为Claude的顶级计算供应商,并凸显了人形智能公司在模型发布和付费层需求增长之前如何积极锁定容量。这种安排在两个方面都很不寻常。位于田纳西州孟菲斯的Colossus 1原本是用于训练Grok的,现在被整体转让给竞争对手实验室。同时,SpaceX在二月份以1.25万亿美元的估值与xAI合并,现在利用这笔交易将合并实体定位为云计算租赁商,而不是纯粹的AI开发商。更高的速率限制立即到来人形智能公司利用新的容量放松了限制。针对Claude Code的五小时速率限制,将为Pro、Max、Team和基于座位的企业计划加倍。对Pro和Max账户在美国商务时间内的峰值小时限制已完全取消。API速率限制对于Claude Opus模型将大幅提高。第一层输入从30,000跳至500,000个令牌每分钟,输出从8,000跳至80,000。第四层客户的输入限制从200万提高到1,000万令牌每分钟,输出从40万提高到80万——在所有四个层面上,限制大约增加了一个数量级,这明显表明计算能力,而不是定价,曾是高容量客户的瓶颈。计算合作伙伴的增长名单SpaceX的交易加入了迅速扩张的投资组合。人形智能公司还单独签署了高达5千兆瓦的协议与亚马逊,与谷歌和Broadcom签署了5千兆瓦的协议,与微软和NVIDIA签署了战略合作协议,价值300亿美元的Azure容量,以及500亿美元的美国数据中心建设与Fluidstack。这些承诺加起来超过10千兆瓦的计算容量,在大约六个月内预订——即使公司权衡9000亿美元的估值在其下一轮融资中。人形智能公司表示,它在NVIDIA GPU、谷歌TPU和AWS Trainium芯片的混合上训练和运行Claude。添加SpaceX作为Colossus 1的单租户出租人不会改变硬件混合,但这意味着该公司现在依赖于直接与埃隆·马斯克(Elon Musk)相关的基础设施,而他的Grok产品正面竞争Claude。两家公司还表示,他们已“表达了兴趣”在共同开发多千兆瓦的轨道AI计算能力——这是SpaceX自二月份以来一直公开推广的项目,人形智能公司在星期三首次明确表示支持。为什么SpaceX突然成为计算出租商从SpaceX的角度来看,Colossus 1一旦xAI将Grok训练转移到附近更大的Colossus 2设施,就变得多余。根据马斯克在X上发布的评论,xAI不再需要两个站点,将未使用的容量出售给人形智能公司可以在SpaceX计划首次公开募股之前将资产变现。这仍然是一个不寻常的逆转:Colossus 1不到一年前还是xAI的旗舰训练集群。这种转变还伴随着xAI内部动荡,其中大多数有名的联合创始人自2026年初以来已经离开,剩下的SpaceX-xAI合并实体越来越依赖基础设施收入。对于人形智能公司来说,政治光谱需要一种变通方法。公司的公告强调,它只会与“民主国家合作,这些国家的法律和监管框架支持这一规模的投资”,这种说法历史上一直被视为与马斯克的公开立场形成对比。人形智能公司在SpaceX交易中没有延伸这种框架。有三个问题随之而来。首先,人形智能公司支付了多少钱——财务条款没有披露,但报告表明该协议可能价值数十亿美元,考虑到Colossus 1代表了SpaceX商业计算机队的重要份额。第二,是否会加速在微软内部进一步解除捆绑,微软最近放松了与OpenAI的独家安排,而人形智能公司则在更多供应商中扩展计算能力。第三,人形智能公司是否能够在其合同计算容量超过10千兆瓦的情况下维持其单独承诺,以吸收其美国数据中心造成的消费者电价增加。
Stripe 于 4 月 29 日推出了一款专为自主 AI 代理时代设计的数字钱包,允许消费者授予软件代理商购物、预订和支付账单的权限,而无需暴露底层卡或银行凭证。该产品,称为 Link 的代理钱包,是一个异常大型产品发布的头条消费者面向部分:288 个新功能和 API 在公司的年度 Stripe 会议上宣布,会议在旧金山举行。CEO 帕特里克·科利森(Patrick Collison)将该包装框为“AI 的经济基础设施”,认为“在不久的将来,代理商将占据大部分在线交易”。该启动使 Link —— 一款拥有超过 2.5 亿全球用户的 Stripe 所有消费者钱包 ——...
人类中心主义公司正在考虑一项大约 50 亿美元的融资,估值在 8500 亿美元至 9000 亿美元之间,据本周多个报道称,这笔交易将使克劳德制造商的价值在不到三个月内增加一倍多,并使其与 OpenAI 并列为世界上最有价值的 AI 初创公司。预计董事会将在五月做出决定,融资可能是人类中心主义公司在十月份可能进行的 IPO 之前的最后一次私人融资。人类中心主义公司拒绝发表评论。定价反映出加速的增长。人类中心主义公司 在二月份以 3800 亿美元的后钱估值筹集了 30 亿美元的 G 轮资金,由 GIC 和 Coatue 领投。按照新的条款,融资将使该数字在大约三个月内增加一倍,并超过 OpenAI 在三月三十一日关闭其自己的记录轮次时达到的...
人类中心的线路 发布了九个新的 Claude 连接器,于 4 月 28 日,将助手直接连接到专业创意人员已经使用的软件中 —— Adobe Creative Cloud、Blender、Ableton Live、Autodesk Fusion、Splice、SketchUp、Affinity by Canva 和 Resolume 的 Arena 和 Wire。该版本将 Claude 转变为设计、3D、音乐和实时视觉管道的编排层。连接器的发布伴随着一个单独的、有资金支持的承诺:人类中心的线路已加入 Blender 开发基金会,成为该基金会的最高级别赞助商。九个连接器的功能每个连接器都暴露了宿主应用程序的不同部分。Ableton...
David Silver 的伦敦人工智能实验室 Ineffable Intelligence 于 4 月 27 日以 11 亿美元种子轮融资和 51 亿美元后钱估值从隐私模式中脱颖而出,这是欧洲初创公司有史以来最大的种子轮融资。红杉资本和 Lightspeed Venture Partners 共同领投了这一轮融资,Nvidia、Google、Index Ventures、DST Global、BOND、EQT、Evantic、Flying Fish、英国商业银行和英国政府的主权 AI 基金也参与了这一轮融资。这一轮融资的规模、产品的缺席以及公司的既定目标——建设所谓的 “超级学习者”,它可以在没有人类数据的情况下学习——使其成为对非 LLM 路径的最激进的赌注之一,也是对高级...
OpenAI 和微软于周一修改了他们长期的合作伙伴关系,结束了微软对 OpenAI 模型的独家许可,使得 AI 实验室可以在任何云平台上销售其完整的产品线,并消除了多年来一直笼罩着双方关系的有争议的 “AGI 条款”。这两家公司通过协调的博客帖子宣布了这些变化,框定为为自 2019 年以来一直是微软 AI 战略的基石的协议带来 “长期清晰度”。 微软的股份 —— 去年十月披露,大约为 1350 亿美元,或大约 OpenAI 27% 的股份,按摊薄计算 —— 仍然保持不变,但两家公司之间几乎所有的运营杠杆都已被重新调整。新协议中发生了什么变化在 微软的公告 中,OpenAI 的产品仍将首先在...
人类本质于4月24日发布了”项目协议“的结果,这是一个为期一周的内部实验,克劳德代理人代表公司旧金山办公室的69名员工购买和出售真实物品。 代理人达成了186笔价值略超过4000美元的交易——研究发现,具有更强大模型的参与者获得了明显更好的结果,而人类对此毫无察觉。 由人类本质研究人员Kevin K. Troy、Dylan Shields、Keir Bradwell和Peter McCrory撰写的研究结果,给出了最清晰的图景,展示了人工智能中介市场的行为,当代理人在交易的两边进行谈判时会发生什么。 他们还提出了一个“令人不安的含义”,该公司表示,行业、监管机构和用户需要在agentic commerce流行之前解决这个问题。 项目协议的工作原理 实验于2025年12月运行了一周。 人类本质招募了69名员工,每人给予100美元的“预算”(以礼品卡的形式支付,实验结束后支付,根据他们购买或出售的物品的价值进行加减),并让克劳德与每个志愿者进行简短的采访,以确定他们想要出售什么、以什么价格出售、想要购买什么以及他们的代理人应该使用什么样的谈判风格。人类本质然后将这些答案转化为每个代理人的自定义系统提示。 人类本质然后在Slack频道内运行了四个并行的市场。 “在A运行和D运行中,每个人的代理人都是基于克劳德Opus 4.5,我们当时的最先进模型,”团队说。“在其他两个运行中(B运行和C运行),参与者有50%的机会被分配到克劳德Haiku 4.5,一个较弱的模型。” 只有A运行是“真正”的运行,货物实际上会在之后更换手;其他三个运行是研究条件,参与者在实验后进行调查之前不知道哪个运行是真实的。 一旦代理人部署,就没有人工干预。 项目的Slack频道随机循环代理人,允许他们发布物品出售、为他人的商品提出报价或达成协议。关键是,一旦实验开始,就没有人工干预。 在超过500个列出的物品中,代理人识别匹配、提议价格并自主达成协议。人类只在实验结束后重新进入画面,物理交换他们的代理人同意交易的商品。 更强大的模型悄悄谈判更好的交易 头条新闻发现很简单:代理质量很重要,它以美元计量。 在161件至少在四个运行中出售的物品中,Opus卖家平均多赚了2.68美元,而Opus买家平均少支付了2.45美元。当Opus卖家面对Haiku买家时,平均价格达到24.18美元,而Opus对Opus的交易为18.63美元。人类本质表示,考虑到中位价12美元和所有运行的平均价格20.05美元,这些差距并非微不足道。 个别案例更为明显。 同一辆坏的折叠自行车,同一个买家,同一个卖家:Opus代理人获得了65美元,而Haiku代理人只获得了38美元。...
DeepSeek,这家在 2025 年 1 月以低成本的 R1 推理模型震撼了行业的中国 AI 实验室,目前正在与投资者谈判,计划至少筹集 3 亿美元的外部资金,这是根据 The Information 的报道。该轮融资将使总部位于杭州的 DeepSeek 估值达到 100 亿美元或以上。这一融资标志着创始人兼 CEO 梁文峰的策略发生了显著的转变,他曾将 DeepSeek 建立为其量化对冲基金 High-Flyer Capital Management 的一个副项目,并多次拒绝了来自主要中国风险投资公司和科技巨头的投资邀请。High-Flyer...
人类中心设计已经发布了 Claude Design,这是一款新的产品,隶属于其 Anthropic Labs 部门,允许用户通过与 Claude 的对话创建原型、幻灯片、单页和其他视觉资产。该工具由 Claude Opus 4.7 提供支持,这是 Anthropic 最新的、最强大的视觉模型,并且对于 Claude Pro、Max、Team 和 Enterprise 订阅者可在研究预览中使用。企业组织必须在其设置中启用它。Claude Design针对特定的缺口:那些有想法但缺乏设计技能或无法访问专业工具的人。创始人构建pitch deck、产品经理绘制功能流程、营销人员草拟活动视觉效果,可以用简单的语言描述他们需要的内容,然后通过内联评论、直接文本编辑或自定义调整滑块来完善,这些滑块由 Claude 自动生成。“描述您需要的内容,Claude 将构建第一个版本,”Anthropic 在其 公告...
人类中心智能即将发布 Claude Opus 4.7 和自然语言设计工具,可能在本周内发布,而风险投资公司已经出价超过 8000 亿美元的估值进行投资——这比公司上一次官方估值高出一倍以上。模型 ID anthropic-claude-opus-4-7 出现在 Google Vertex AI 的配额管理页面 上,用于 EU 多区域部署,于 4 月 16 日出现,这一模式与之前的 Claude 发布一致。 The Information 报道...
斯坦福的 人机交互人工智能研究所 于 4 月 13 日发布了其 2026 AI 指数报告,记录了一个具有中心悖论的领域:人工智能能力以历史性的速度发展,而用于管理、评估和理解该技术的系统却越来越落后。年度报告 —— 人工智能轨迹最全面的公共核算 —— 跟踪了几十个国家的技术性能、经济影响、公共情绪和政策发展。本年度版描绘了一个行业的图景,该行业在科学和数学方面取得了惊人的里程碑、吸引了创纪录的投资,并且比个人电脑或互联网更快地渗透到日常生活中。但它也记录了公众信任的侵蚀、最大的 AI 公司透明度的下降以及人工智能取代初级工人的首个具体证据。https://www.youtube.com/watch?v=ouIeC1fogvU突破性表现 —— 和持续的盲点根据报告的发现,人工智能模型现在已达到或超过了人类基准的 PhD 级科学问题、竞争级数学和多模态推理。在 SWE-bench Verified 编码基准上,性能从 60% 跃升至几乎 100%...
OpenAI 已收购 Hiro,一家拥有 AI 功能的个人理财初创公司,后者开发了所谓的“个人 AI 财务总监”,此次交易将约 10 名员工和金融科技专业知识带入 ChatGPT 背后的公司。Hiro 的联合创始人 Ethan Bloch 宣布了此次收购,确认团队将加入 OpenAI,以更大的规模继续开发金融工具。此次交易被结构为 acqui-hire,即以人才为焦点的收购,OpenAI 获得了 Hiro 的工程团队,而不是其产品。Hiro 已停止接受新注册,应用程序将于 2026 年 4 月 20...
中国 AI 公司 MiniMax 已经发布了 MiniMax M2.7 的权重,这是一个 229 亿参数的 Mixture-of-Experts 模型,它参与了自己的开发周期——标志着公司所谓的第一步向自主 AI 自我进化迈进。最初 于 3 月 18 日宣布,MiniMax M2.7 现在在 Hugging Face 上免费提供,支持 SGLang、vLLM、Transformers 和...
Google 和 Intel 已宣布了一项多年扩展的云基础设施合作伙伴关系,致力于继续在 Google Cloud 上部署 Intel Xeon 处理器,并扩展为 AI 工作负载设计的自定义基础设施处理单元 (IPU) 的联合开发。协议 于 4 月 9 日宣布,涵盖两个领域:Google Cloud 将继续使用多代 Intel Xeon 处理器,包括最新的 Xeon 6...