Trí tuệ nhân tạo

Trợ lý trò chuyện Meena mới của Google có thể giữ cuộc trò chuyện hợp lý, cụ thể về gần như mọi thứ

Published February 1, 2020

Updated April 28, 2026

Daniel Nelson

Mặc dù các trợ lý ảo như Siri, Alexa và Google Assistant rất ấn tượng và hữu ích, nhưng kỹ năng trò chuyện của chúng thường bị giới hạn ở việc nhận các lệnh cụ thể và đưa ra các phản hồi đã được định nghĩa trước. Các công ty như Google và Amazon đã theo đuổi các phương pháp đào tạo và phát triển AI để có thể làm cho các rô-bốt trò chuyện AI trở nên mạnh mẽ và linh hoạt hơn, có thể tham gia vào các cuộc trò chuyện với người dùng một cách tự nhiên hơn. Theo báo cáo của DigitalTrends, Google gần đây đã xuất bản một bài báo trình diễn khả năng của rô-bốt trò chuyện mới của mình, được gọi là “Meena”. Theo một bài đăng trên blog từ các nhà nghiên cứu, Meena có thể tham gia vào cuộc trò chuyện với người dùng về gần như mọi chủ đề.

Meena là một rô-bốt trò chuyện miền mở, có nghĩa là nó phản hồi với ngữ cảnh của cuộc trò chuyện cho đến nay và thích nghi với các đầu vào để đưa ra các phản hồi tự nhiên hơn. Hầu hết các rô-bốt trò chuyện khác là miền đóng, có nghĩa là phản hồi của chúng được tập trung vào các ý tưởng cụ thể và bị giới hạn ở việc thực hiện các nhiệm vụ cụ thể.

Theo báo cáo của Google, sự linh hoạt của Meena là kết quả của một tập dữ liệu đào tạo lớn. Meena được đào tạo trên khoảng 40 tỷ từ được lấy từ các cuộc trò chuyện trên mạng xã hội và lọc để lấy các từ có liên quan và đại diện nhất. Google nhằm giải quyết một số vấn đề được tìm thấy trong hầu hết các trợ lý giọng nói, chẳng hạn như khả năng xử lý các chủ đề và lệnh mà mở rộng trên nhiều lượt trong cuộc trò chuyện, với người dùng cung cấp thêm đầu vào sau khi rô-bốt đã phản hồi một đầu vào. Điều này có nghĩa là nhiều rô-bốt trò chuyện không thể yêu cầu người dùng làm rõ và khi có một truy vấn không thể giải thích, chúng thường chỉ mặc định về kết quả web.

Để giải quyết vấn đề cụ thể này, các nhà nghiên cứu của Google đã cho phép các thuật toán của mình theo dõi ngữ cảnh của cuộc trò chuyện, có nghĩa là nó có thể tạo ra các câu trả lời cụ thể. Mô hình sử dụng một bộ mã hóa xử lý những gì đã được nói trong cuộc trò chuyện và một bộ giải mã tạo ra một phản hồi dựa trên ngữ cảnh. Mô hình được đào tạo trên dữ liệu cụ thể và không cụ thể. Dữ liệu cụ thể là các từ có liên quan chặt chẽ đến câu lệnh trước. Theo bài đăng trên blog của Google:

“Ví dụ, nếu A nói, ‘Tôi yêu thích tennis,’ và B trả lời, ‘Đó là điều tuyệt vời,’ thì câu nói nên được đánh dấu, ‘không cụ thể’. Câu trả lời đó có thể được sử dụng trong hàng chục ngữ cảnh khác nhau. Nhưng nếu B trả lời, ‘Tôi cũng vậy, tôi không thể đủ của Roger Federer!’, thì nó được đánh dấu là ‘cụ thể’ vì nó liên quan chặt chẽ đến chủ đề đang được thảo luận.

Dữ liệu được sử dụng để đào tạo mô hình bao gồm bảy “lượt” trong cuộc trò chuyện. Trong quá trình đào tạo, mô hình có 2,6 tỷ tham số đã kiểm tra 341 GB dữ liệu văn bản để tìm kiếm các mẫu, một tập dữ liệu lớn hơn khoảng 8,5 lần so với tập dữ liệu được sử dụng để đào tạo mô hình GPT-2 được tạo bởi OpenAI.

Google báo cáo về cách Meena hoạt động tại chỉ số Trung bình Cảm nhận và Cụ thể (SSA). SSA là một chỉ số được thiết kế bởi các nhà nghiên cứu của Google và nó nhằm mục đích lượng hóa khả năng của một thực thể trò chuyện để trả lời các phản hồi cụ thể, liên quan khi cuộc trò chuyện diễn ra.

Các điểm SSA được tính toán bằng cách kiểm tra mô hình chống lại một số lượng cố định các lệnh, và số lượng phản hồi hợp lý mà mô hình đưa ra được theo dõi. Điểm của mô hình được tính dựa trên tỷ lệ phần trăm của các phản hồi hợp lý / cụ thể mà mô hình có thể đưa ra so với các lệnh. Các phản hồi chung chung bị phạt. Theo Google, một người trung bình đạt khoảng 86% trên SSA, trong khi Meena có thể đạt được 79%. Một mô hình AI khác nổi tiếng, một tác nhân được tạo bởi Pandora Bots, đã giành giải thưởng Loebner vì thực tế là các bot AI của họ đã đạt được giao tiếp giống con người tinh vi. Tác nhân Pandora Bots đạt khoảng 56% trong thử nghiệm SSA.

Microsoft và Amazon cũng đang cố gắng tạo ra các rô-bốt trò chuyện linh hoạt và tự nhiên hơn. Microsoft đã cố gắng tạo ra cuộc trò chuyện nhiều lượt trong các rô-bốt trò chuyện trong hai năm, thâu tóm Semantic Machines, một công ty khởi nghiệp AI, để cải thiện Cortana. Amazon gần đây đã tổ chức thử thách Alexa Prize, điều này đã thúc giục các tham gia thiết kế một bot có thể trò chuyện trong khoảng 20 phút.

Daniel Nelson

Blogger và lập trình viên với chuyên môn về Machine Learning và Deep Learning topics. Daniel hy vọng giúp đỡ người khác sử dụng sức mạnh của AI cho lợi ích xã hội.

Unite.AI

Trợ lý trò chuyện Meena mới của Google có thể giữ cuộc trò chuyện hợp lý, cụ thể về gần như mọi thứ

You may like