人工智能

苹果智能的混合 AI 栈:为什么 Gemini 成为核心角色

mm

Unite.AI is committed to rigorous editorial standards. We may receive compensation when you click on links to products we review. Please view our affiliate disclosure.

https://www.unite.ai/why-agentic-ai-still-breaks-in-the-real-world/

过去一年里,人工智能领域一直在关注一场高风险的棋局,OpenAI、Google 和 Anthropic 都在争夺消费技术中最有价值的位置:iPhone 的默认层。2026 年 1 月 12 日,这场游戏结束了。苹果和谷歌 确认了一项多年合作伙伴关系,将 Gemini 直接集成到苹果智能的核心中。

这不仅仅是一个供应商的更换,而是 iOS 上人工智能功能的根本性重构。最初的 WWDC 公告强调了 ChatGPT,但苹果的长期战略需要一个不仅仅是一个聊天机器人,而是一个可扩展的、多模态的推理引擎,能够处理数十亿每日查询,并具有低延迟。谷歌的 Gemini,由其定制的 TPU 基础设施提供支持,证明是唯一能够满足这一规模的模型。

混合 AI 栈解释

该集成引入了一个复杂的三层架构,用于平衡隐私和原始力量。了解这一栈是理解为什么选择 Gemini 而不是 GPT-4o 或 Claude 的关键。

1. 设备模型(边缘层)

对于大约 60% 的日常任务——排序通知、重写文本或搜索本地应用程序数据——苹果将继续使用其专有的 3B 和 7B 参数模型在神经引擎(NPU)上运行。这确保了零延迟和完全的个人数据隐私。

2. 私有云计算(隐私桥梁)

当请求太复杂,无法在手机上处理,但需要敏感数据(例如“检查我的日历并预订一张桌子”)时,它将被路由到苹果的私有云计算(PCC)。这些服务器运行苹果硅基 LLMs,不会保留数据。

3. Gemini(世界知识层)

这是新的合作伙伴关系接管的地方。对于“世界知识”查询——复杂推理、创造性生成或实时信息检索——Siri 现在将请求无缝地转交给 Gemini。与之前的实现不同,用户不需要确认“您想使用 ChatGPT?”,Gemini 被集成为一个本地系统进程。

为什么谷歌赢得了操作系统层

选择谷歌而不是 OpenAI 的决定归结为三个关键因素:基础设施、多模态和上下文。

  • 垂直集成:OpenAI 依赖于微软的 Azure 基础设施和英伟达的 GPU。谷歌控制其整个栈,从 Gemini 模型到其数据中心中的 Trillium TPUs。这使谷歌能够为苹果提供保证的吞吐量和较低的延迟,成本基础是 OpenAI 可能无法匹配的。
  • 本地多模态:Gemini 本地训练了视频、音频和文本。随着 Siri 演变为一个可以“看到”屏幕内容和“听到”环境上下文的代理,Gemini 的本地架构为这些功能提供了比拼接单独模型更平滑的路径。
  • “代理”未来:苹果的“应用程序意图”框架需要一个可以计划跨多个应用程序的多步骤操作的 AI。谷歌在过去一年中优化了 Gemini 以适应 代理工作流(计划、推理和工具使用),这与苹果的 Siri 2.0 路线图完美匹配。

OpenAI 的新现实:插件时代

对于 OpenAI来说,这个公告标志着一个重大的战略收缩。虽然 Sam Altman 的公司仍然是纯模型能力的领导者,但失去 iOS 默认位置限制了他们进入普通消费者生活的“上下文窗口”的机会。

ChatGPT 将保持在 iOS 上的可用性,但它有效地成为一个专门的“插件”或技能——类似于维基百科或沃尔夫勒姆阿尔法今天的功能。用户可以调用它来执行特定的创意写作任务或编码辅助,但它将不再是操作系统日常交互的无处不在的大脑。

隐私工程作为防火墙

技术专家们立即对谷歌——一个数据广告公司——获得 iPhone 查询的机会表示担忧。然而,技术实现表明存在严格的防火墙。

苹果的请求路由在数据到达谷歌服务器之前对其进行匿名处理。IP 地址被屏蔽,发送到 Gemini 的“上下文”被剥夺个人标识符。关键的是,合同明确禁止谷歌使用任何苹果来源的流量来训练其模型。对于谷歌来说,价值不在于数据,而在于将 Gemini 规范化为 AI 的标准实用工具,防止用户转向第三方应用程序。

这对开发者意味着什么

对于开发者生态系统来说,这种整合带来了稳定性。苹果的 CoreML 和 App Intents 框架现在将与 Gemini 的推理模式无缝协同工作。构建“Siri 感知”应用程序的开发者可以期待更一致的行为,当 AI 解释用户意图并执行复杂命令时。

我们可能会看到“代理应用程序”的激增——旨在不仅被人类使用,还被 Gemini 驱动的 Siri 控制的应用程序。不管是复杂的旅行预订、自动化的财务规划还是跨应用程序内容创建,基础设施终于为移动设备上的真正 AI 代理奠定了基础。

结论:双头垄断巩固

2024 年和 2025 年的人工智能战争被模型主导的混乱所定义。2026 年正在定义分销渠道。通过选择谷歌,苹果巩固了一个现实,即两个最大的移动操作系统由相同的 基础智能架构 提供支持。

对于行业来说,这表明拥有“最后一英里”到用户的机会与拥有实验室中最聪明的模型一样重要。Gemini 可能不是第一个发起者,但通过确保 iPhone,它已经有效地成为移动网络的标准操作大脑。

Daniel 是一个大力提倡人工智能最终将颠覆一切的人。他呼吸着技术,活着就是为了尝试新的小工具。