Trí tuệ nhân tạo
Những ứng dụng MCP là gì? Tiêu chuẩn mới biến các phản hồi AI thành giao diện tương tác

Giao thức ngữ cảnh mô hình vừa nhận được phần mở rộng chính thức đầu tiên và nó thay đổi những gì các trợ lý AI có thể làm. MCP Apps cho phép các công cụ trả về các giao diện người dùng tương tác – bảng điều khiển, biểu mẫu, hình ảnh hóa, luồng thanh toán – được hiển thị trực tiếp trong cuộc trò chuyện thay vì dưới dạng phản hồi văn bản.
Phần mở rộng, được công bố vào ngày 26 tháng 1, đại diện cho sự hợp tác giữa Anthropic, OpenAI và những người duy trì cộng đồng. Nó giải quyết vấn đề mà nhóm MCP gọi là “tính năng được yêu cầu nhiều nhất từ cộng đồng MCP”: khả năng cho các phản hồi AI bao gồm các yếu tố tương tác mà người dùng có thể thao tác mà không cần nhập lời nhắc khác.
Để hiểu tại sao điều này lại quan trọng, bạn cần hiểu MCP là gì và nó đang thay đổi hệ sinh thái công cụ AI như thế nào.
Model Context Protocol là gì?
Giao thức ngữ cảnh mô hình Model Context Protocol là một tiêu chuẩn mở mà Anthropic giới thiệu vào tháng 11 năm 2024 để giải quyết một vấn đề cơ bản: các trợ lý AI bị cách ly với dữ liệu và công cụ mà mọi người thực sự sử dụng. Mỗi tích hợp – kết nối AI với lịch của bạn, tệp của bạn, phần mềm kinh doanh của bạn – yêu cầu triển khai tùy chỉnh.
MCP tiêu chuẩn hóa các kết nối này. Hãy nghĩ về nó như USB-C cho các ứng dụng AI. Giống như USB-C cung cấp một cách phổ quát để kết nối thiết bị với thiết bị ngoại vi, MCP cung cấp một cách phổ quát để kết nối mô hình AI với các hệ thống bên ngoài.
Giao thức này tuân theo kiến trúc client-server. Các máy chủ MCP (như Claude Desktop hoặc ChatGPT) kết nối với các máy chủ MCP, là các chương trình nhẹ cung cấp các khả năng cụ thể. Một máy chủ MCP có thể cung cấp quyền truy cập vào Google Calendar của bạn, cơ sở dữ liệu của công ty bạn hoặc một công cụ chuyên dụng như Figma.
Điều làm cho MCP mạnh mẽ là các mô hình AI trở thành các bên tham gia tích cực chứ không phải là người nhận dữ liệu bị động. Các mô hình có thể gọi các công cụ tại thời điểm chạy thông qua giao thức, thực hiện các hành động thay vì chỉ mô tả các hành động có thể được thực hiện.
Tiêu chuẩn này đã đạt được sự áp dụng nhanh chóng. OpenAI chính thức áp dụng MCP vào tháng 3 năm 2025. Vào tháng 12, Anthropic đã quyên góp giao thức cho Quỹ Agentic AI dưới sự bảo trợ của Linux Foundation, với Google, Microsoft và AWS tham gia với tư cách là thành viên. Cùng một cách tiếp cận tiêu chuẩn mở mà Anthropic sử dụng cho khuôn khổ kỹ năng của nó hiện đang định hình cách toàn ngành xây dựng các tích hợp AI.
Điều gì mà MCP Apps thêm vào?
Cho đến nay, các công cụ MCP trả về văn bản. Hỏi một AI để kiểm tra lịch của bạn, và nó sẽ mô tả lịch trình của bạn bằng từ. Hỏi nó để phân tích dữ liệu, và nó sẽ tóm tắt các phát hiện dưới dạng đoạn văn. AI có thể truy cập các công cụ, nhưng đầu ra luôn là văn bản được hiển thị trong cửa sổ trò chuyện.
MCP Apps thay đổi điều này. Các công cụ hiện có thể trả về các giao diện HTML được hiển thị dưới dạng các yếu tố tương tác trong cuộc trò chuyện. Một công cụ lịch có thể hiển thị một lưới lịch thực mà bạn có thể nhấp vào ngày. Một công cụ phân tích dữ liệu có thể hiển thị các biểu đồ mà bạn có thể di chuột qua để xem chi tiết. Một công cụ mua sắm có thể trình bày một biểu mẫu thanh toán mà bạn có thể điền trực tiếp.
Việc triển khai kỹ thuật sử dụng các iframe được cách ly để đảm bảo an ninh. Các máy chủ MCP tuyên bố các mẫu UI của chúng trước, và máy khách (Claude, ChatGPT hoặc các máy chủ khác) hiển thị chúng trong các môi trường bị cô lập ngăn chặn việc thực thi mã độc.
Trải nghiệm này biến AI từ một đối tác trò chuyện mô tả các hành động thành một lớp giao diện trình bày các điều khiển có thể thực hiện. Mô hình vẫn nằm trong vòng lặp – nó nhìn thấy những gì người dùng làm và phản hồi tương ứng – nhưng giao diện UI xử lý những gì văn bản không thể: cập nhật trực tiếp, trình xem phương tiện bản địa, trạng thái tồn tại và thao tác trực tiếp.
Tại sao điều này lại quan trọng
Hãy xem xét sự khác biệt trong thực tế. Không có MCP Apps, việc khám phá dữ liệu đòi hỏi phải nhắc lại lặp đi lặp lại: “Hiển thị cho tôi doanh số theo khu vực.” “Bây giờ lọc đến Q4.” “Sắp xếp theo doanh thu.” Mỗi tương tác có nghĩa là nhập một lời nhắc mới và chờ đợi phản hồi văn bản.
Với MCP Apps, AI trả về một bảng dữ liệu tương tác. Nhấp vào tiêu đề cột để sắp xếp. Kéo các thanh trượt để lọc phạm vi ngày. Di chuột qua các giá trị để xem chi tiết. AI theo dõi các tương tác này và có thể phản hồi lại – “Tôi nhận thấy bạn đang tập trung vào khu vực Đông Bắc; đây là phân tích sâu hơn” – nhưng việc khám phá diễn ra thông qua thao tác trực tiếp chứ không phải thông qua cuộc trò chuyện.
Điều này đóng một khoảng trống đã hạn chế các trợ lý AI kể từ khi ChatGPT ra mắt. Tích hợp của Adobe vào ChatGPT gợi ý về những gì có thể khi AI có thể trình bày các giao diện trực quan. MCP Apps tiêu chuẩn hóa khả năng đó để bất kỳ nhà phát triển nào cũng có thể xây dựng nó.
Đồng sáng lập và tính khả dụng
Anthropic đã triển khai hỗ trợ MCP Apps trong Claude cho người đăng ký Pro, Max, Team và Enterprise. Các tích hợp ban đầu đến từ các đối tác ra mắt bao gồm Amplitude, Asana, Box, Canva, Clay, Figma, Hex, monday.com và Slack. Tích hợp Salesforce sắp ra mắt.
Kết quả thực tế: người dùng có thể xây dựng dòng thời gian dự án trong Asana, soạn thảo tin nhắn Slack đã định dạng, tạo và chỉnh sửa sơ đồ Figma và quản lý tệp Box – tất cả đều trong giao diện trò chuyện của Claude. Mỗi công cụ trình bày giao diện bản địa của nó thay vì buộc người dùng mô tả những gì họ muốn bằng văn bản.
Đối với các nhà phát triển, Anthropic đã xuất bản kho lưu trữ ext-apps với SDK và các ví dụ làm việc. Các triển khai tham chiếu bao gồm hình ảnh hóa 3D với Three.js, bản đồ tương tác, xem PDF, bảng điều khiển giám sát hệ thống thời gian thực và ký hiệu nhạc. Đặc tả mở có nghĩa là các nhà phát triển có thể xây dựng MCP Apps hoạt động trên bất kỳ máy khách nào hỗ trợ phần mở rộng.
Toàn cảnh lớn hơn
MCP Apps tiếp tục chiến lược của Anthropic trong việc xây dựng cơ sở hạ tầng ngành công nghiệp dưới dạng tiêu chuẩn mở. Công ty đã quyên góp MCP cho kết nối công cụ, Agent Skills cho tùy chỉnh khả năng và MCP Apps cho giao diện tương tác – mỗi thứ được phát hành một cách cởi mở thay vì là các tính năng độc quyền.
Cách tiếp cận này đảo ngược động lực học phần mềm truyền thống. Thay vì các ứng dụng chứa các tính năng AI, AI trở thành giao diện mà thông qua đó các ứng dụng được truy cập. MCP Apps làm cho giao diện đó trở nên phong phú hơn bằng cách cho phép các công cụ trình bày các điều khiển trực quan thay vì chỉ mô tả văn bản.
Đối với người dùng, lợi ích ngay lập tức là các quy trình làm việc mượt mà hơn. Các hành động đòi hỏi phải chuyển đổi giữa các ứng dụng hoặc nhập lời nhắc chi tiết có thể diễn ra thông qua các nhấp chuột và kéo. Đối với các nhà phát triển, MCP Apps cung cấp một kênh phân phối mới – xây dựng một công cụ tương tác một lần và nó hoạt động trong bất kỳ trợ lý AI nào hỗ trợ phần mở rộng.
Phần mở rộng này đã sẵn sàng sản xuất kể từ ngày 26 tháng 1. Liệu MCP Apps có trở nên phổ biến như chính MCP hay không sẽ phụ thuộc vào việc các nhà phát triển xây dựng các triển khai hấp dẫn như thế nào – và kiến trúc iframe được cách ly xử lý các thách thức an ninh của việc chạy các giao diện web tùy ý bên trong các cuộc trò chuyện AI.












