Kết nối với chúng tôi

Nền tảng AI lai của Apple Intelligence: Vì sao Gemini giành được vai trò cốt lõi

Trí tuệ nhân tạo

Nền tảng AI lai của Apple Intelligence: Vì sao Gemini giành được vai trò cốt lõi

mm

Unite.AI cam kết tuân thủ các tiêu chuẩn biên tập nghiêm ngặt. Chúng tôi có thể nhận được tiền bồi thường khi bạn nhấp vào liên kết đến các sản phẩm mà chúng tôi xem xét. xin vui lòng xem của chúng tôi công bố liên kết.

https://www.unite.ai/why-agentic-ai-still-breaks-in-the-real-world/
Nhanh chóng:
Apple đã chính thức lựa chọn Gemini của Google làm mô hình nền tảng cho các tính năng Apple Intelligence dựa trên điện toán đám mây. Bước chuyển đổi chiến lược này định vị lại OpenAI từ vai trò cơ sở hạ tầng cốt lõi sang khả năng tùy chọn, chuyên dụng cho từng tác vụ, báo hiệu rằng cơ sở hạ tầng và khả năng đa phương thức của Google đã giành chiến thắng trong cuộc chiến giành vị trí trên lớp hệ điều hành của iPhone.

Một kiến ​​trúc mới cho Trí tuệ nhân tạo di động

Trong năm qua, lĩnh vực trí tuệ nhân tạo đã chứng kiến ​​một ván cờ căng thẳng giữa OpenAI, Google và Anthropic, tất cả đều tranh giành vị trí quan trọng nhất trong công nghệ tiêu dùng: lớp mặc định của iPhone. Vào ngày 12 tháng 1 năm 2026, ván cờ đã kết thúc. Apple và Google xác nhận Một thỏa thuận hợp tác nhiều năm nhằm tích hợp Gemini trực tiếp vào lõi của Apple Intelligence.

Đây không chỉ đơn thuần là việc thay đổi nhà cung cấp; mà là sự tái cấu trúc cơ bản về cách thức hoạt động của trí tuệ nhân tạo trên iOS. Mặc dù các thông báo ban đầu tại WWDC đã nhấn mạnh ChatGPT, chiến lược dài hạn của Apple đòi hỏi một đối tác không chỉ cung cấp chatbot, mà còn là một công cụ suy luận đa phương thức, có khả năng mở rộng, xử lý hàng tỷ truy vấn mỗi ngày với độ trễ thấp. Gemini của Google, được hỗ trợ bởi cơ sở hạ tầng TPU tùy chỉnh của hãng, đã chứng minh là mô hình duy nhất sẵn sàng cho quy mô này.

Giải thích về “Hệ thống AI lai”

Việc tích hợp này giới thiệu một kiến ​​trúc ba tầng phức tạp cho Apple Intelligence, được thiết kế để cân bằng giữa quyền riêng tư và sức mạnh xử lý. Hiểu rõ kiến ​​trúc này là chìa khóa để hiểu tại sao Gemini được chọn thay vì GPT-4o hoặc Claude.

1. Mô hình trên thiết bị (Lớp biên)

Đối với khoảng 60% các tác vụ hàng ngày—sắp xếp thông báo, viết lại văn bản hoặc tìm kiếm dữ liệu ứng dụng cục bộ—Apple sẽ tiếp tục sử dụng các mô hình tham số 3B và 7B độc quyền của mình chạy cục bộ trên Neural Engine (NPU). Điều này đảm bảo độ trễ bằng không và bảo mật tuyệt đối cho dữ liệu cá nhân.

2. Điện toán đám mây riêng (Cầu nối bảo mật)

Khi một yêu cầu quá phức tạp đối với điện thoại nhưng lại cần dữ liệu nhạy cảm (ví dụ: “Kiểm tra lịch của tôi và đặt bàn”), yêu cầu đó sẽ được chuyển đến Máy chủ điện toán đám mây riêng của Apple (PCC). Các máy chủ này chạy các mô-đun quản lý vòng đời con người (LLM) dựa trên chip của Apple và không lưu trữ dữ liệu lâu dài.

3. Song Tử (Tầng Tri thức Thế giới)

Đây là lúc sự hợp tác mới phát huy tác dụng. Đối với các truy vấn "kiến thức thế giới" - suy luận phức tạp, tạo nội dung sáng tạo hoặc truy xuất thông tin theo thời gian thực - Siri giờ đây sẽ chuyển giao yêu cầu một cách liền mạch cho Gemini. Không giống như cách triển khai trước đây, nơi người dùng phải xác nhận "Bạn có muốn sử dụng ChatGPT không?", Gemini được tích hợp như một tiến trình hệ thống gốc.

Vì sao Google thắng ở lớp hệ điều hành?

Quyết định gạt bỏ OpenAI để ưu tiên Google xuất phát từ ba yếu tố quan trọng: Cơ sở hạ tầng, Đa phương thức và Bối cảnh.

  • Nhập theo chiều dọcOpenAI dựa trên cơ sở hạ tầng Azure của Microsoft và GPU Nvidia. Google kiểm soát toàn bộ hệ thống của mình, từ các mô hình Gemini cho đến các TPU Trillium tùy chỉnh trong các trung tâm dữ liệu của họ. Điều này cho phép Google cung cấp cho Apple thông lượng được đảm bảo và độ trễ thấp hơn với mức chi phí mà OpenAI khó có thể sánh kịp.
  • Đa phương thức bản địaGemini được huấn luyện trực tiếp trên video, âm thanh và văn bản cùng lúc. Khi Siri phát triển thành một trợ lý ảo có thể "nhìn thấy" những gì trên màn hình và "nghe thấy" ngữ cảnh xung quanh, kiến ​​trúc gốc của Gemini cung cấp một lộ trình mượt mà hơn cho các tính năng này so với việc ghép nối các mô hình riêng biệt.
  • Tương lai “Đại diện”Khung “App Intents” của Apple yêu cầu một trí tuệ nhân tạo (AI) có khả năng lập kế hoạch các hành động nhiều bước trên các ứng dụng khác nhau. Google đã dành cả năm qua để tối ưu hóa Gemini cho mục đích này. quy trình làm việc của agentic (lập kế hoạch, suy luận và sử dụng công cụ), hoàn toàn phù hợp với lộ trình của Apple dành cho Siri 2.0.

Thực tại mới của OpenAI: Kỷ nguyên “Plugin”

Đối với OpenAI, thông báo này đánh dấu một sự thu hẹp chiến lược đáng kể. Mặc dù công ty của Sam Altman vẫn là công ty dẫn đầu về khả năng mô hình hóa thuần túy, việc mất đi vị trí mặc định trên iOS sẽ hạn chế khả năng tiếp cận của họ vào "cửa sổ ngữ cảnh" trong cuộc sống của người tiêu dùng thông thường.

ChatGPT sẽ vẫn có sẵn trên iOS, nhưng về cơ bản nó sẽ trở thành một "plugin" hoặc kỹ năng chuyên dụng—tương tự như cách Wikipedia hoặc WolframAlpha hoạt động hiện nay. Người dùng có thể sử dụng nó cho các nhiệm vụ viết sáng tạo cụ thể hoặc hỗ trợ lập trình, nhưng nó sẽ không còn là "bộ não" toàn năng điều khiển các tương tác hàng ngày của hệ điều hành nữa.

Kỹ thuật bảo mật như một bức tường lửa

Những người am hiểu công nghệ ngay lập tức bày tỏ lo ngại về việc Google - một công ty quảng cáo dựa trên dữ liệu - có thể truy cập vào các truy vấn trên iPhone. Tuy nhiên, cách thức triển khai kỹ thuật cho thấy một tường lửa nghiêm ngặt.

Hệ thống định tuyến yêu cầu của Apple ẩn danh dữ liệu trước khi dữ liệu đến máy chủ của Google. Địa chỉ IP được che giấu, và "ngữ cảnh" được gửi đến Gemini được loại bỏ các thông tin nhận dạng cá nhân. Quan trọng hơn, hợp đồng cấm rõ ràng Google sử dụng bất kỳ lưu lượng truy cập nào có nguồn gốc từ Apple để huấn luyện mô hình của mình. Đối với Google, giá trị không nằm ở dữ liệu, mà ở việc chuẩn hóa Gemini như một tiện ích tiêu chuẩn cho trí tuệ nhân tạo, ngăn người dùng chuyển sang sử dụng các ứng dụng của bên thứ ba.

Điều này có ý nghĩa gì đối với các nhà phát triển

Đối với hệ sinh thái nhà phát triển, sự hợp nhất này mang lại sự ổn định. Các framework CoreML và App Intents của Apple giờ đây sẽ được tối ưu hóa để hoạt động liền mạch với các mô hình suy luận của Gemini. Các nhà phát triển xây dựng ứng dụng "nhận biết Siri" có thể kỳ vọng vào hành vi nhất quán hơn trong cách AI diễn giải ý định của người dùng và thực hiện các lệnh phức tạp.

Chúng ta có thể sẽ chứng kiến ​​sự bùng nổ của "Ứng dụng thông minh" - những ứng dụng được thiết kế không chỉ để con người sử dụng mà còn để được điều khiển bởi Siri, một trợ lý ảo dựa trên công nghệ Gemini. Cho dù đó là đặt vé du lịch phức tạp, lập kế hoạch tài chính tự động hay tạo nội dung đa ứng dụng, nền tảng cho các trợ lý AI thực sự trên thiết bị di động cuối cùng cũng đang được xây dựng.

Kết luận: Thế độc quyền kép ngày càng vững chắc

Cuộc chiến AI năm 2024 và 2025 được định hình bởi cuộc tranh giành vị thế thống trị mô hình. Năm 2026 đang định hình các kênh phân phối. Bằng việc lựa chọn Google, Apple đã khẳng định một thực tế rằng hai hệ điều hành di động lớn nhất đều được hỗ trợ bởi cùng một kiến ​​trúc trí tuệ nhân tạo.

Đối với ngành công nghiệp, điều này cho thấy việc kiểm soát "chặng cuối" đến tay người dùng cũng quan trọng không kém việc sở hữu mô hình thông minh nhất trong phòng thí nghiệm. Gemini có thể không phải là người tiên phong ngay từ đầu, nhưng bằng việc giành được quyền kiểm soát iPhone, nó đã trở thành bộ não điều hành tiêu chuẩn của web di động.

Khám phá thêm các phân tích chuyên sâu về mặt kỹ thuật liên quan đến kiến ​​trúc LLM và tích hợp AI trên thiết bị di động tại đây. đoàn kết.ai.

Daniel là người ủng hộ mạnh mẽ việc AI cuối cùng sẽ phá vỡ mọi thứ như thế nào. Anh ấy hít thở công nghệ và sống để thử những tiện ích mới.