Connect with us

Artificial Intelligence

Google Định Tuyến Các Truy Vấn Phức Tạp trong AI Overviews Đến Gemini 3 Pro

mm

Google hiện đang định tuyến các truy vấn phức tạp trong AI Overviews đến mô hình mạnh nhất của họ, Gemini 3 Pro, trong khi các mô hình nhanh hơn tiếp tục xử lý các tìm kiếm đơn giản.

Hệ thống định tuyến thông minh, mà Google lần đầu triển khai trong Chế độ AI vào năm ngoái, giờ đây đã mở rộng sang các bản tóm tắt do AI tạo ra xuất hiện trực tiếp bên dưới truy vấn tìm kiếm cho 2 tỷ người dùng hàng tháng. Bản nâng cấp này có sẵn bằng tiếng Anh trên toàn cầu—nhưng chỉ dành cho người đăng ký trả phí của Google AI Pro ($19.99/tháng) hoặc AI Ultra.

“Ở hậu trường, Tìm kiếm sẽ thông minh định tuyến những câu hỏi khó nhất của bạn đến mô hình tiên phong của chúng tôi trong khi tiếp tục sử dụng các mô hình nhanh hơn cho các tác vụ đơn giản hơn,” Robby Stein, Phó Chủ tịch Sản phẩm cho Google Tìm kiếm, đã viết trong thông báo.

Người Đăng Ký Được Tiếp Cận Đầu Tiên Với Khả Năng Lập Luận Tiên Phong

Việc triển khai phân tầng này tiếp tục chiến lược của Google là dành riêng các khả năng AI mạnh mẽ nhất của mình cho khách hàng trả phí. Trong khi Gemini 3 Flash hiện cung cấp sức mạnh cho trải nghiệm mặc định cho tất cả người dùng trong Chế độ AI, việc truy cập khả năng lập luận nâng cao của Gemini 3 Pro yêu cầu một gói đăng ký.

Người đăng ký Google AI Pro nhận được 100 lệnh Gemini 3 Pro mỗi ngày, trong khi người dùng AI Ultra nhận được 500 lệnh. Công ty gần đây đã tăng các giới hạn này—hạn mức chế độ “Suy nghĩ” của AI Pro đã tăng từ 100 lên 300 lệnh hàng ngày—cho thấy nhu cầu của người đăng ký đối với mô hình có khả năng cao hơn.

Sự khác biệt này quan trọng vì Gemini 3 Pro mang đến một khoảng cách khả năng đáng kể so với Flash. Google định vị nó là “có khả năng cao trong việc giải quyết các vấn đề phức tạp trên một loạt chủ đề rộng lớn như khoa học và toán học với độ tin cậy cao,” với cửa sổ ngữ cảnh 1 triệu token có thể xử lý khoảng 1.500 trang văn bản.

Đối với các truy vấn phức tạp đòi hỏi lập luận nhiều bước hoặc hiểu biết sắc thái, quá trình xử lý sâu hơn của Pro có thể cải thiện đáng kể chất lượng câu trả lời. Nhưng bức tường trả phí có nghĩa là hầu hết 2 tỷ người dùng hàng tháng của AI Overviews sẽ không thấy những cải tiến này—họ sẽ tiếp tục nhận được phản hồi từ các mô hình nhanh hơn, ít khả năng hơn.

Quản lý Sản phẩm Google Tìm kiếm Robby Stein (X)

Query Fan-Out Cung Cấp Sức Mạnh Cho Hệ Thống

Trí thông minh định tuyến dựa vào điều mà Stein trước đây gọi là “query fan-out”—một kỹ thuật trong đó mô hình AI sử dụng Google Tìm kiếm như một công cụ để thực hiện các truy vấn bổ sung, thu thập thông tin liên quan hơn trước khi tổng hợp phản hồi.

Cách tiếp cận này khác với retrieval-augmented generation đơn giản. Thay vì kéo từ một tập hợp tài liệu đã lập chỉ mục cố định, hệ thống mở rộng tìm kiếm của nó một cách linh hoạt dựa trên độ phức tạp và bản chất của câu hỏi, về lý thuyết tạo ra các câu trả lời toàn diện và chính xác hơn.

Google đã mở rộng mạnh mẽ nơi Gemini xuất hiện trên các sản phẩm của mình. Cùng tuần với bản nâng cấp AI Overviews, công ty đã đưa Gemini AI đến Gmail với các bản tóm tắt và trả lời thông minh, và trước đó đã ra mắt các tính năng Personal Intelligence kết nối Gemini với dữ liệu cá nhân của người dùng trên các dịch vụ của Google.

Công ty báo cáo rằng ứng dụng Gemini hiện có hơn 650 triệu người dùng hàng tháng, hơn 70% khách hàng Google Cloud sử dụng Google AI, và 13 triệu nhà phát triển đã xây dựng với các mô hình sinh của nó.

Câu Hỏi Về Bức Tường Trả Phí

Quyết định của Google về việc khóa các AI Overviews được cải thiện sau gói đăng ký đặt ra câu hỏi về tương lai của tìm kiếm. Công ty đã xây dựng vị thế thống trị của mình bằng cách cung cấp quyền truy cập miễn phí vào thông tin của thế giới; giờ đây tìm kiếm tốt nhất được hỗ trợ bởi AI của họ yêu cầu $20 hàng tháng.

Phép tính cạnh tranh rõ ràng. Tìm kiếm ChatGPT của OpenAI, Perplexity và các công cụ tìm kiếm AI khác đều đang tranh giành người dùng muốn có câu trả lời được hỗ trợ bởi AI. Google không thể để tụt hậu về khả năng, nhưng việc cho đi các mô hình đắt đỏ nhất của mình miễn phí sẽ làm sụp đổ biên lợi nhuận.

Hiện tại, sự thỏa hiệp là một hệ thống hai tầng: mọi người đều nhận được AI Overviews được cung cấp bởi các mô hình nhanh, hiệu quả, trong khi người đăng ký được truy cập khả năng lập luận tiên phong khi câu hỏi trở nên khó. Liệu sự phân chia đó có được duy trì khi cạnh tranh tìm kiếm AI gia tăng—hay liệu Google cuối cùng có đẩy nhiều khả năng hơn ra sau bức tường trả phí hay không—vẫn là một câu hỏi mở.

Bản nâng cấp cũng đến chỉ vài ngày sau khi Google rút AI Overviews khỏi một số truy vấn y tế nhất định sau một báo cáo thông tin sai lệch, một lời nhắc nhở rằng các mô hình mạnh hơn không tự động có nghĩa là các câu trả lời đáng tin cậy hơn. Khi Google định tuyến các truy vấn phức tạp đến AI có khả năng nhất của mình, mức độ quan trọng của việc đưa ra những câu trả lời đúng chỉ tăng lên.

Alex McFarland là một nhà báo và cây viết về AI, chuyên khám phá những phát triển mới nhất trong lĩnh vực trí tuệ nhân tạo. Anh đã hợp tác với nhiều công ty khởi nghiệp AI và ấn phẩm trên toàn thế giới.