Connect with us

人工智能

什么是MCP应用?新的标准将AI响应转化为交互式接口

mm

Model Context Protocol刚刚获得了其首个官方扩展,并改变了AI助手可以做的事情。MCP应用程序允许工具返回交互式用户界面——仪表盘、表单、可视化、结账流程——这些界面直接在对话中渲染,而不是作为文本响应。

扩展于1月26日宣布,是Anthropic、OpenAI和社区维护者之间的合作。它解决了MCP团队所谓的“MCP社区最常请求的功能之一”:AI响应中包含交互元素的能力,用户可以在不输入另一个提示的情况下操作这些元素。

为了了解为什么这很重要,您需要了解什么是MCP以及它如何重塑AI工具生态系统。

什么是模型上下文协议?

模型上下文协议是Anthropic在2024年11月引入的开放标准,旨在解决一个基本问题:AI助手与人们实际使用的数据和工具隔离。每个集成——将AI连接到您的日历、文件、商业软件——都需要自定义实现。

MCP标准化了这些连接。可以将其想象为AI应用程序的USB-C。就像USB-C提供了一种通用方式来连接设备到外设一样,MCP提供了一种通用方式来连接AI模型到外部系统。

该协议遵循客户端-服务器架构。MCP主机(如Claude Desktop或ChatGPT)连接到MCP服务器,这些服务器是轻量级程序,暴露特定的功能。MCP服务器可能提供访问您的Google日历、公司数据库或专用工具(如Figma)的功能。

MCP之所以强大,是因为AI模型成为活动参与者,而不是数据的被动接收者。模型可以通过协议在运行时调用工具,执行操作,而不仅仅是描述可能采取的操作。

该标准已获得快速采用。OpenAI在2025年3月正式采用MCP。12月,Anthropic将协议捐赠给Agentic AI基金会,隶属于Linux基金会,Google、Microsoft和AWS加入为成员。Anthropic用于其技能框架的相同开放标准方法现在正在塑造整个行业如何构建AI集成。

MCP应用程序添加了什么?

到目前为止,MCP工具返回文本。要求AI检查您的日历,它将用文字描述您的时间表。要求它分析数据,它将以段落的形式总结发现。AI可以访问工具,但输出始终是渲染在聊天窗口中的文本。

MCP应用程序改变了这一点。工具现在可以返回渲染为对话中交互式元素的HTML接口。日历工具可能会显示一个实际的日历网格,您可以点击日期。数据分析工具可能会显示您可以悬停以获取详细信息的图表。购物工具可能会呈现一个结账表单,您可以直接填写。

技术实现使用沙盒化的iframe以实现安全。MCP服务器提前声明其UI模板,客户端(Claude、ChatGPT或其他主机)在隔离环境中渲染它们,这些环境可以防止恶意代码执行。

这种体验将AI从描述操作的对话伙伴转变为呈现可操作控件的接口层。模型保持在循环中——它看到用户执行什么操作并相应地做出反应——但UI处理文本无法处理的内容:实时更新、原生媒体查看器、持久状态和直接操作。

为什么这很重要

考虑实践中的区别。没有MCP应用程序,探索数据需要迭代提示:“按地区显示销售额。”“现在筛选到第四季度。”“按收入排序。”每次交互都意味着输入一个新提示并等待文本响应。

使用MCP应用程序,AI返回一个交互式数据表。点击列标题进行排序。拖动滑块以筛选日期范围。悬停在值上以查看详细信息。AI监视这些交互并可以对其做出反应——“我注意到您专注于东北地区;以下是更深入的分析”——但探索发生在直接操作中,而不是对话中。

这填补了一个自ChatGPT推出以来一直限制AI助手的差距。Adobe的ChatGPT集成暗示了当AI可以呈现视觉界面时可能发生的事情。MCP应用程序标准化了该功能,因此任何开发人员都可以构建它。

启动合作伙伴和可用性

Anthropic已在Claude的Pro、Max、Team和Enterprise订阅者中推出了MCP应用程序支持。初始集成来自包括Amplitude、Asana、Box、Canva、Clay、Figma、Hex、monday.com和Slack在内的启动合作伙伴。Salesforce集成即将推出。

实际结果:用户可以从Claude的聊天界面内构建Asana项目时间表、草拟格式化的Slack消息、创建和编辑Figma图表以及管理Box文件。每个工具呈现其本机UI,而不是强迫用户用文本描述他们想要什么。

对于开发人员,Anthropic已发布ext-apps存储库,包含SDK和工作示例。参考实现包括使用Three.js的3D可视化、交互式地图、PDF查看、实时系统监控仪表盘和乐谱符号。开放规范意味着开发人员可以构建在任何支持扩展的客户端上工作的MCP应用程序。

更大的图景

MCP应用程序继续Anthropic的战略,即以开放标准的形式构建行业基础设施。该公司现在已经贡献了MCP用于工具连接、Agent Skills用于功能自定义以及MCP应用程序用于交互式接口——每一个都是公开发布的,而不是作为专有功能。

这种方法颠倒了传统软件动态。应用程序不再包含AI功能,AI成为访问应用程序的接口。MCP应用程序通过让工具呈现视觉控件而不是仅仅文本描述使该接口更加丰富。

对于用户来说,立即的好处是更流畅的工作流程。需要在应用程序之间切换或输入详细提示的操作现在可以通过点击和拖动来完成。对于开发人员,MCP应用程序提供了一个新的分发渠道——一次构建交互式工具,它就可以在任何支持扩展的AI助手中工作。

该扩展自1月26日起已准备好投入生产。MCP应用程序是否会像MCP本身一样变得无处不在,将取决于开发人员如何快速构建令人信服的实现,以及沙盒化iframe架构如何处理在AI对话中运行任意Web接口的安全挑战。

Alex McFarland 是一名人工智能记者和作家,探索最新的人工智能发展。他曾与世界各地的众多人工智能初创公司和出版物合作。