

Anthropic 于1月12日发布了 Cowork,这是一个桌面智能体,通过一个简单的基于文件夹的界面,将 Claude Code 的能力带给非技术用户。作为扩展的 Anthropic Labs 计划的一部分宣布的研究预览版,移除了终端这一障碍,该障碍曾使得最强大的人工智能工具之一对大多数专业人士来说遥不可及。 Cowork 在 macOS 的 Claude Desktop 应用程序内运行。用户选择一个文件夹,Claude 便获得在该目录内读取、编辑和创建文件的能力——所有这些都通过自然语言聊天来控制。结果是,用户无需知道什么是文件系统沙箱或如何操作命令行,就能获得 Claude Code 的智能体能力。 这一时机标志着一个战略性的转变。Claude Code 在六个月内从研究预览版成长为价值十亿美元的产品,主要服务于开发者。但Anthropic注意到了一些意想不到的情况:开发者用它来研究度假信息、制作幻灯片、整理电子邮件以及从硬盘中恢复婚礼照片。Cowork 将这种行为正式化为一个为所有人设计的产品。 这对专业人士为何重要 Claude...


LambdaTest 已更名为 TestMu AI,此举正式确立了该公司从一个基于云的测试平台向一个全栈、智能体化人工智能系统的转型,该系统旨在处理软件质量问题,以应对代码生成速度远超人类合理测试能力的时代。这一新身份反映的是多年来的架构和产品转型,而非一次营销重置。TestMu AI 将质量工程定位为现代软件开发中的一个自主、持续学习的层面——它能够推理变更、适应新的代码路径,并以与人工智能驱动开发本身相同的速度运行。从云测试基础设施到质量智能LambdaTest 成立于 2018 年,最初专注于解决一个具体的基础设施问题:使团队能够在无需维护自有测试实验室的情况下,在数千种真实浏览器和设备上测试 Web 和移动应用程序。其基于云的执行引擎减少了测试的不稳定性,缩短了反馈循环,并在快速发展的开发团队中得到了广泛采用。随着平台的成熟,LambdaTest 扩展了其能力,不再局限于执行,而是大力投资于编排、分析和开发者工作流集成。到 2020 年代初,它已成为全球使用最广泛的云测试平台之一,为在持续交付环境中运营的企业大规模执行测试。然而,随着生成式人工智能开始重塑软件的编写方式,该公司发现了一个结构性错配:传统测试——主要围绕静态脚本和人工维护的自动化构建——正成为一个瓶颈。代码生成正在加速,但质量系统在很大程度上仍然是被动的。更名为何重要向 TestMu AI 的转变反映了该公司如何应对这种错配。从 2022 年开始,LambdaTest 围绕智能体化人工智能重新构建了其平台,嵌入了能够以最少人工干预进行规划、生成、执行和分析测试的自主系统。其名称本身来源于 TestMu 大会,这是该公司发起的一个社区驱动论坛,旨在探索测试和人工智能增强质量工程的未来。随着时间的推移,TestMu 从一个活动演变为测试生态系统中一个可识别的身份。将其作为公司名称,标志着 TestMu AI 正将其平台及其社区定位为共同进化的系统。TestMu...


OpenAI于12月17日开放了ChatGPT的应用提交,推出了一个应用目录,其每周8亿用户可以在对话中直接发现并连接第三方服务。此举借鉴了苹果App Store的模式,极大地增强了ChatGPT的功能。 初始合作伙伴包括Spotify、Booking.com、DoorDash、Dropbox、Google Drive和Apple Music。开发者现在可以通过OpenAI的Apps SDK提交应用以供审核。 应用能做什么 应用通过引入外部上下文并支持操作来扩展ChatGPT的对话功能——例如订购杂货、预订旅行、创建演示文稿或搜索公寓。这与2024年1月推出的GPT商店不同,后者提供的是定制化的聊天机器人角色,而应用则连接到实际的服务,并能执行现实世界的交易。 应用目录分为“精选”、“生活方式”和“生产力”等类别,可通过工具菜单或chatgpt.com/apps访问。用户无需离开ChatGPT界面即可浏览、连接并与服务互动。符合OpenAI质量标准并受用户欢迎的应用可能会获得更突出的展示位置,或由ChatGPT本身进行推荐。 目前,开发者只能通过链接到其原生应用或网站来实现盈利。OpenAI表示正在探索内部盈利方案,但尚未承诺采用收入分成模式或应用内购买系统。 平台战略 应用商店是OpenAI从模型提供商向平台公司演进的最新一步。与Adobe的集成将Photoshop和Acrobat带入ChatGPT。即时结账功能通过PayPal和Stripe实现了商业交易。Atlas浏览器则将ChatGPT扩展至具备智能体能力的网页导航领域。 每一部分都朝着同一个目标迈进:使ChatGPT成为用户与数字服务交互的主要界面。如果OpenAI成功,那么让ChatGPT预订航班或订购晚餐将变得像点击应用图标一样自然——而底层服务则成为看不见的基础设施。 这一战略逻辑与苹果App Store取得变革性成功的逻辑如出一辙。iPhone不仅仅是一部手机;它成为了第三方接触用户的界面。OpenAI押注对话式AI能够实现同样的中介作用。 这对开发者意味着什么 机会巨大但前景不明。触及8亿用户意味着大多数应用梦寐以求的分发渠道。ChatGPT的推荐系统可能以传统应用商店难以匹敌的方式推动应用发现——如果ChatGPT能在对话中根据上下文建议应用,用户就无需主动搜索。 但经济模式仍不清晰。没有应用内盈利机制,开发者必须将ChatGPT用户转化为自己平台的直接客户。这与iOS应用的价值主张不同,后者的交易发生在生态系统内部。开发者本质上是在用分发渠道换取转化摩擦。 审核流程也带来了风险。OpenAI控制着应用的发布和展示。与OpenAI自身功能——或未来功能——构成竞争的应用显然面临冲突。公司的质量标准是主观的,历史表明,随着生态系统成熟,平台所有者很少能保持中立裁判的角色。 竞争影响 谷歌面临最直接的挑战。Gemini与Google Workspace深度集成,但缺乏OpenAI正在构建的第三方应用生态系统。如果用户更喜欢通过一个他们无法控制的对话中介来访问服务,那么谷歌的优势——拥有用户所需的服务——反而可能成为弱点。 Anthropic和其他AI实验室面临不同的问题。Claude在推理和编码方面表现出色,但尚未追求如此规模的平台雄心。如果ChatGPT的应用生态系统创造了转换成本——用户依赖于已连接的服务、围绕特定集成构建的工作流程——那么仅凭模型质量竞争可能就不够了。 更广泛的问题是,对话式AI能否支撑起一个平台业务。应用商店之所以成功,是因为用户养成了使用单个应用的习惯。而ChatGPT的价值主张恰恰相反:一个让单个应用变得不必要的统一界面。开发者是否会投资于一个旨在让他们“隐形”的平台,仍有待观察。 目前,OpenAI正在发出信号:它已开放商业合作。应用即将到来。问题在于,经济模式是否对所有参与者都有效——还是仅仅对OpenAI有效。


OpenAI 今日发布了 GPT-5.2,这是在首席执行官萨姆·阿尔特曼因谷歌的 Gemini 3 超越公司先前旗舰模型而宣布内部”红色警报”后,不到一个月内推出的模型。 此次加速发布标志着 OpenAI 迄今为止最快的主要模型迭代。GPT-5.1 在 GPT-5 发布后三个月才推出,但竞争压力极大地压缩了这一时间线。在 OpenAI 的基准测试图表中,GPT-5.2 Thinking 在各种推理测试中略微领先于 Gemini 3 和 Anthropic 的 Claude Opus 4.5。 “我们设计 5.2...


OpenAI 已任命 Slack CEO Denise Dresser 为其首位首席营收官,此举标志着这家 ChatGPT 制造商正致力于将其庞大的用户群转化为可持续的企业收入。 Dresser 将负责监督 OpenAI 在企业销售和客户成功方面的全球营收战略,该公司周二宣布。她将向首席运营官 Brad Lightcap 汇报,预计将于下周开始工作。 此次招聘正值 OpenAI 为全球超过一百万企业客户提供服务之际,其中包括 Walmart、Morgan Stanley、Intuit、Databricks、Target 和 Lowe’s。随着 ChatGPT 拥有每周 8...


Anthropic 宣布 Claude Code 即将登陆 Slack,使开发人员能够直接从聊天对话中委派编码任务,而无需离开其团队工作区。 该集成以研究预览版形式推出,允许开发人员在 Slack 线程中标记 @Claude,以利用最近的频道上下文启动编码会话。当开发人员在频道中提到错误报告或功能请求时,Claude Code 可以分析对话内容,确定相关代码库,并开始着手解决问题,同时在帖子中发布进度更新。 该系统可以分享已完成工作的审查链接并打开拉取请求,实现从对话到代码的无缝转换,无需开发人员切换应用程序。对于已经以 Slack 为中心的工程团队而言,该集成消除了在聊天和开发环境之间切换上下文的摩擦。 更深度的平台集成 Slack 集成建立在 Anthropic 与 Salesforce 于10 月宣布的更广泛合作伙伴关系之上。该协议在 Claude 与 Slack...


苹果已任命 Amar Subramanya 为其新任人工智能副总裁,接替 John Giannandrea。Giannandrea 在领导公司机器学习工作七年后宣布退休。 Subramanya 在谷歌工作了16年,曾担任 Gemini Assistant 的工程负责人,之后在微软短暂担任人工智能企业副总裁。他为在现代化 Siri 方面进展艰难的公司带来了深厚的对话式人工智能专业知识。他将向苹果软件工程高级副总裁 Craig Federighi 汇报,而非像 Giannandrea 那样直接向首席执行官 Tim Cook 汇报。 Cook 在苹果的官方公告中表示:“人工智能长期以来一直是苹果战略的核心,我们很高兴欢迎 Amar 加入...


唐纳德·J·特朗普总统启动了一项名为”创世使命“的重大国家人工智能计划,旨在改变美国进行科学研究的方式。该计划被定位为自阿波罗时代以来联邦科学资源的最大规模动员。”创世使命”责成能源部(DOE)及其国家实验室网络,将美国最杰出的科学人才、最强大的超级计算机和海量数据整合到一个协作的、人工智能驱动的研究系统中。通过利用先进的人工智能,该计划旨在显著加快医学、能源和材料科学等领域的科学突破,将发现时间从数年缩短至数天甚至数小时。 特朗普在白宫的一次活动中正式宣布了”创世使命”,将其定位为由人工智能引领的新发现时代。总统将该计划的紧迫性和规模与历史上的国家项目相提并论,并表示”纵观历史,从曼哈顿计划到阿波罗任务,我们国家最杰出的人才和产业总是在需要时响应号召。””创世使命”被呈现为再次号召这些人才,以开启美国创新和人工智能领导地位的”新黄金时代”。能源部长克里斯·赖特已被指示牵头该计划。其他关键人物包括达里奥·吉尔博士(能源部负责科学的副部长,被指定为”创世使命”主任)、白宫科学顾问迈克尔·克拉齐奥斯,以及担任特朗普人工智能与加密货币特别顾问的科技企业家大卫·O·萨克斯,他将负责协调更广泛的政策整合。 创世使命的目标与战略重点 “创世使命”的既定目标是通过利用人工智能作为研究生产力的倍增器,来加速科学发现的速度。白宫设想,通过统筹人工智能和先进计算,该计划可以在十年内使美国科学与工程的生产力和影响力翻倍。实际上,这意味着利用人工智能来自动化和优化实验设计、数据分析和模拟等任务——从而在以往所需时间的一小部分内实现突破。 “创世使命”下的优先研究领域涵盖了能源部确定的20项最紧迫的科学技术挑战。这些领域包括: 生物技术与健康——发现新的疾病疗法和生物工程进展 能源技术——从先进核裂变与核聚变到电网现代化 关键材料——改进材料科学以保障供应链安全 太空探索——应用人工智能实现太空技术突破 量子信息科学——利用量子计算与人工智能 半导体与微电子——加速芯片设计与制造 这些重点领域旨在加强美国的技术领导力、经济竞争力和国家安全。 创世使命关键要点一览 该计划通过一项于2025年11月24日签署的行政命令启动,由特朗普总统与能源部高级领导层共同宣布。它被定位为与阿波罗计划或曼哈顿计划同等规模的国家项目。 该使命的领导层包括发起人唐纳德·J·特朗普总统、牵头机构负责人能源部长克里斯·赖特、使命主任达里奥·吉尔博士(能源部负责科学的副部长)、白宫科学顾问迈克尔·克拉齐奥斯,以及人工智能与加密货币特别顾问大卫·萨克斯。 该使命的目标聚焦于在十年内使美国研发生产力翻倍,加速生物技术、能源和关键材料等关键领域的科学发现,并加强美国的技术领导力和国家安全。 其战略重点涵盖至少二十项高影响力的科学技术挑战,包括生物技术、先进制造、关键材料、核裂变与核聚变、太空探索、量子信息科学和半导体。 该计划的核心是创建一个人工智能实验平台,将联邦超级计算机、先进人工智能模型和大型科学数据集连接到一个安全、闭环的系统中,以加速研究工作流程。 该使命设有明确的里程碑:60天内确定优先挑战,90天内清点国家计算资源,120天内编目基本数据集和人工智能模型,240天内评估机器人实验室和自动化设施,270天内展示初始运行能力。 在资源方面,该计划利用能源部17个国家实验室网络、其超级计算机及其广泛的数据存储库。启动时未分配专项资金;相反,该工作从现有资源开始,预计未来将获得国会支持。 该计划也拥抱公私合作,鼓励与学术界和工业界建立伙伴关系。英伟达和Anthropic等公司已表示参与。 最后,其政策立场强调轻触式监管,倾向于统一的联邦人工智能标准,并优先考虑创新而非限制性监督,以保持国家竞争力。 构建人工智能平台与技术支柱 “创世使命”的一个核心内容是创建一个复杂的人工智能驱动研究平台,该平台将连接联邦计算资源和科学设施。这个”美国科学与安全平台”被设想为美国政府用于战略部门的AI引擎。能源部将把高性能计算集群(包括全国最快的超级计算机)与庞大的联邦数据集和先进的人工智能工具整合到一个安全的闭环网络中。 在此环境中,将部署特定领域基础模型和自主人工智能代理等人工智能系统来探索科学问题。它们将提出假设、设计和模拟实验、分析结果,甚至实时控制机器人实验室。这种基础设施将把物理研发实验室与数字能力连接起来,创建从数据到发现的无缝管道。 该平台有望成为世界上最复杂的科学仪器,供超过40,000名能源部科学家和工程师使用。与私营部门创新者的合作将受到严格的网络安全协议和对敏感数据的保护措施约束。政府的目标是确保人工智能创新既快速又安全。...


Anthropic 已正式发布 Claude Opus 4.5,标志着其迄今为止能力最强的 大型语言模型 (LLM),具备先进的编码性能和企业级生产力功能。 这款旗舰模型在 SWE-bench Verified 上取得了 80.9% 的成绩,确立了其在 AI 代码生成领域的当前领先地位,并与 OpenAI 的最新模型展开直接竞争。Opus 4.5 在智能体工作流方面表现出色,展示了改进的任务优化能力,仅需四次迭代即可达到峰值能力,而竞争模型则需要 10 次尝试。 新模型的定价通过 Claude API 为每百万输入 tokens...
Google 今日发布了 Gemini 3 Pro,标志着其迄今为止最先进的 AI 模型问世,该模型拥有破纪录的基准测试成绩以及一个名为 Antigravity 的新型智能体开发平台。该模型在 LMArena 上获得 1501 Elo 分,超越了 Gemini 2.5 Pro 的 1451 分,并在各大 AI 评估指标中占据榜首位置。 此次发布正值 AI 行业数月期待之后,该模型已于 10...


Perplexity AI今日宣布与Snap达成一项价值4亿美元的交易,其AI驱动的搜索引擎将从2026年初开始触达近十亿Snapchat用户。这项为期一年、以现金和股权支付的合作,将把Perplexity的对话式AI搜索功能直接集成到Snapchat现有的聊天界面中。 根据协议,Snapchat用户将能够在应用内提问,并获得基于已验证信息的清晰、对话式的回答,而无需离开平台。该功能将作为补充,而非取代自2023年2月就已上线的Snapchat现有My AI聊天机器人。Perplexity的集成将作为一个专门的答案引擎,用于实时信息发现。 Perplexity首席执行官Aravind Srinivas表示:”数百万人通过Snapchat连接彼此并探索世界。通过将Perplexity引入Snapchat,我们能够在好奇心产生的地方直接满足它。” 这笔交易标志着Perplexity最大的商业合作伙伴关系之一,该公司正在与成熟的AI搜索引擎和对话式AI平台竞争。 财务影响与战略愿景 该公告与Snap 2025年第三季度财报一同发布。财报显示,Snap营收达15.1亿美元,同比增长10%,超过了分析师预期的14.9亿美元。在此双重公告发布后,Snap股价在盘后交易中飙升超过20%。 Snap首席执行官Evan Spiegel强调了公司更广泛的AI战略:”我们的目标是让AI变得更个性化、更具社交性和趣味性——融入你的友谊、Snaps和对话之中。此次合作反映了我们对AI增强Snapchat上发现与连接能力的共同愿景,我们期待未来与更多创新伙伴合作。” 随着该功能在全球范围内推出,来自Perplexity合作的收入将从2026年开始计入Snap的财务业绩。该公司报告称,2025年第三季度月活跃用户数为9.43亿,日活跃用户数为4.77亿,同比分别增长7%和8%。 此次合作使Snap与Meta和X并驾齐驱,后两者同样在其社交媒体平台中集成了AI助手。Snap此前曾推出基于OpenAI技术的My AI,但Perplexity的集成增加了专注于获取和引用可信信息的专业搜索能力。 Snap还报告调整后EBITDA增长38%,达到1.82亿美元,并提供了2025年第四季度营收指引,预计在16.8亿至17.1亿美元之间,意味着同比增长8%至10%。该公司第三季度调整后毛利率提高至55%,高于第二季度的52%和去年同期的54%。对于希望利用类似AI功能的企业而言,社交媒体AI工具和AI营销工具正在持续扩展客户互动和内容发现的能力。


OpenAI 与 Amazon Web Services 签署了一项价值 380 亿美元的协议,使其云计算资源多元化,不再局限于 Microsoft,并获得了数十万个 Nvidia GPU 的使用权,合作将持续到 2026 年。 这项 为期七年的协议 为 OpenAI 提供了配备 Nvidia GB200 和 GB300 AI 加速器的 Amazon...


OpenAI 推出了 AgentKit,这是一个综合性平台,旨在显著简化 AI 智能体的构建、部署和优化。该平台在公司 DevDay 2025 活动期间宣布,代表了向生产就绪的“智能体”系统的重大转变——这种 AI 不仅能响应提示,还能跨多个步骤采取有意义的行动。在演示期间,首席执行官 Sam Altman 将 AgentKit 描述为一套完整的构建模块,供开发人员以更低的复杂度设计、测试和完善自主智能体。此次发布标志着 OpenAI 在大型语言模型之外最重要的一次扩展,表明了该公司意图主导整个智能体开发流程。统一的智能体开发平台多年来,构建一个 AI 智能体需要同时处理各种零散的工具——模型 API、编排脚本、第三方连接器、评估框架和自定义界面。AgentKit 通过将所有内容整合到一个统一的生态系统中,消除了这种摩擦。该平台的核心是四个无缝协作的基础组件:智能体构建器 提供了一个可视化的拖放画布,用于映射智能体的决策逻辑。开发人员可以创建多步骤工作流,连接推理链,并对进度进行版本控制,而无需编写大量粘合代码。连接器注册中心 作为连接外部数据和服务的中心枢纽。它提供了与 Dropbox、Google Drive 和企业系统等流行工具的预构建集成,同时让管理员完全控制数据访问和权限。聊天工具包...


OpenAI 已正式发布其旗舰 AI 语言模型的最先进版本 GPT-5,这标志着生成式 AI 能力的一次重大飞跃。GPT-5 将于 2025 年 8 月向全球 ChatGPT 用户推出,被誉为迈向通用人工智能长期愿景的变革性一步。首席执行官 Sam Altman 将 GPT-5 描述为 “通往 AGI 道路上的重要一步”——一个感觉像是在与任何领域的专家交谈的系统,具备博士级的深度和推理能力。他将从 GPT-4 到 GPT-5 的跨越比作从早期智能手机屏幕到高清视网膜显示屏的飞跃:更清晰、更锐利,能力也大幅提升。此次发布有望重塑企业、教育工作者和创意人士在日常工作中使用...


美国联邦政府已签署了一项首创性协议,与OpenAI合作,以仅为每个机构1美元的价格,向所有联邦机构提供ChatGPT Enterprise访问权限,这标志着华盛顿推动人工智能融入公共服务迈出了重要一步。这项由美国总务管理局通过其OneGov计划主导的合作,旨在加速生成式人工智能在整个政府范围内的采用,同时降低成本并提高效率。它也直接支持白宫的《美国人工智能行动计划》,该计划概述了联邦政府在各部门扩大人工智能使用的战略。迈向人工智能驱动政府的1美元飞跃根据协议条款,OpenAI将向每个联邦机构提供ChatGPT Enterprise——其安全、企业级的人工智能助手——费用为一年期一次性仅1美元。各机构还将额外获得60天对OpenAI最先进模型的无限访问权限。除了访问权限,OpenAI还提供了一套教育工具,包括针对政府工作流程定制的培训模块、合作伙伴主导的学习会议以及为联邦用户设立的专属社区。该公司强调,政府用户输入的任何数据都不会用于训练其模型,所有部署都将符合联邦安全和隐私标准。GSA代理局长迈克尔·里加斯称此举是特朗普政府巩固美国作为全球人工智能领导者地位努力的一部分。OpenAI首席执行官萨姆·奥尔特曼补充道:“确保人工智能为所有人服务的最佳方式之一,就是将其交到为我们国家服务的人们手中。”该协议支持联邦关于负责任使用人工智能的指导方针,包括管理和预算办公室备忘录M-25-21和M-25-22,这些备忘录敦促各机构采用安全、高效和透明的人工智能技术,以更好地服务美国公众。美国协议与全球人工智能合作的比较联邦政府与OpenAI达成的每个机构1美元的协议,因其规模和可负担性而引人注目。在世界各地,其他政府也在与OpenAI合作——但采用不同的模式和目标: 爱沙尼亚:爱沙尼亚正在将ChatGPT整合到其国家中学课程中,为学生和教师提供定制的ChatGPT Edu平台访问权限。该计划包括辅导、课程规划和人工智能辅助学习的工具,使爱沙尼亚成为人工智能驱动教育的全球领导者。 加州州立大学:CSU已在23个校区部署了ChatGPT Edu,覆盖超过46万名学生和6.3万名教职员工。这是目前全球最大的以教育为重点的ChatGPT实施项目,旨在提高学习成果并减少行政工作量。 美国国防部:五角大楼已向OpenAI及其他科技公司授予了一份价值2亿美元的合同,以探索人工智能在国家安全领域的应用。虽然与GSA的协议是分开的,但它反映了军事和国防部门对生成式人工智能日益增长的兴趣。 这些合作突显了将人工智能引入公共基础设施——从国家教育系统到公民服务——的全球增长趋势。美国政府象征性的1美元协议独特之处在于,它以最低成本提供了企业级的人工智能访问权限,消除了传统的采购障碍,允许每个联邦机构参与。下一步计划未来一年将作为一个试验场,测试ChatGPT在支持联邦工作流程——从起草文件到回应公众咨询——方面的有效性。如果成功,该计划可能会扩大,并成为未来政府范围内人工智能部署的典范。GSA已经列出了其他模型,如Anthropic的Claude和Google的Gemini,供各机构使用。但与OpenAI的合作是目前最引人注目和最易获得的,为各部门的公务员提供了直接接触先进生成式人工智能工具的机会。随着联邦政府开启可能是公共服务中使用人工智能的变革性篇章,完整公告可在GSA.gov上查阅。