Trí tuệ nhân tạo

Mô hình thần kinh mới cho phép giao tiếp ngôn ngữ AI-to-AI

Published March 24, 2024

Updated April 27, 2026

Alex McFarland

Trong một bước nhảy vĩ đại cho trí tuệ nhân tạo (AI), một nhóm từ Đại học Geneva (UNIGE) đã thành công trong việc phát triển một mô hình mô phỏng một đặc điểm duy nhất của con người: thực hiện các nhiệm vụ dựa trên hướng dẫn bằng lời nói hoặc viết và sau đó truyền đạt chúng cho người khác. Thành tựu này giải quyết một thách thức lâu dài trong AI, đánh dấu một cột mốc trong sự tiến hóa của lĩnh vực này.

Lịch sử, các hệ thống AI đã excelled trong việc xử lý lượng lớn dữ liệu và thực hiện các tính toán phức tạp. Tuy nhiên, chúng đã liên tục thất bại trong các nhiệm vụ mà con người thực hiện một cách trực giác – học một nhiệm vụ mới từ các hướng dẫn đơn giản và sau đó diễn đạt quá trình đó cho người khác sao chép. Khả năng không chỉ hiểu mà còn truyền đạt các hướng dẫn phức tạp là một minh chứng cho các chức năng nhận thức tiên tiến mà đã vẫn còn là một đặc điểm đặc trưng của trí tuệ con người.

Bước đột phá của nhóm UNIGE vượt ra ngoài việc thực hiện nhiệm vụ và đi vào tổng quát hóa ngôn ngữ giống con người tiên tiến. Nó liên quan đến một mô hình AI có khả năng hấp thụ hướng dẫn, thực hiện các nhiệm vụ được mô tả và sau đó trò chuyện với một ‘hệ thống AI chị em’ để truyền đạt quá trình bằng ngôn ngữ, cho phép sao chép. Sự phát triển này mở ra những khả năng chưa từng có trong AI, đặc biệt là trong lĩnh vực tương tác giữa con người và AI cũng như robot, nơi giao tiếp hiệu quả là rất quan trọng.

Thách thức trong việc sao chép các khả năng nhận thức của con người trong AI

Các kỹ năng nhận thức của con người thể hiện khả năng học hỏi và truyền đạt các nhiệm vụ phức tạp. Những khả năng này, sâu sắc trong các hệ thống nhận thức thần kinh của chúng ta, cho phép chúng ta nhanh chóng hiểu hướng dẫn và truyền đạt sự hiểu biết của mình cho người khác một cách mạch lạc. Việc sao chép sự tương tác phức tạp giữa việc học hỏi và diễn đạt ngôn ngữ trong AI đã là một thách thức đáng kể. Không giống như con người, các hệ thống AI truyền thống đã yêu cầu đào tạo rộng rãi trên các nhiệm vụ cụ thể, thường dựa vào các tập dữ liệu lớn và học tăng cường lặp lại. Khả năng của một AI để trực giác nắm bắt một nhiệm vụ từ hướng dẫn tối thiểu và sau đó diễn đạt sự hiểu biết của nó đã vẫn còn là một điều khó khăn.

Khoảng cách này trong các khả năng của AI nhấn mạnh những hạn chế của các mô hình hiện có. Hầu hết các hệ thống AI hoạt động trong khuôn khổ của các thuật toán và tập dữ liệu được lập trình, thiếu khả năng suy diễn hoặc suy luận ngoài quá trình đào tạo. Do đó, tiềm năng của AI để thích nghi với các tình huống mới hoặc truyền đạt những hiểu biết theo cách giống con người là rất hạn chế.

Nghiên cứu của UNIGE đại diện cho một bước tiến quan trọng trong việc vượt qua những hạn chế này. Bằng cách thiết kế một mô hình AI không chỉ thực hiện các nhiệm vụ dựa trên hướng dẫn mà còn truyền đạt các nhiệm vụ này cho một thực thể AI khác, nhóm tại UNIGE đã chứng minh một bước tiến quan trọng trong các khả năng nhận thức và ngôn ngữ của AI. Sự phát triển này gợi ý về một tương lai nơi AI có thể bắt chước việc học hỏi và giao tiếp giống con người, mở ra cánh cửa cho các ứng dụng đòi hỏi sự tương tác và thích nghi động như vậy.

Đóng góp khoảng cách với Xử lý Ngôn ngữ Tự nhiên

Xử lý Ngôn ngữ Tự nhiên (NLP) đứng ở tiền phong trong việc bắc cầu khoảng cách giữa ngôn ngữ con người và sự hiểu biết của AI. NLP cho phép máy móc hiểu, diễn giải và phản hồi ngôn ngữ con người một cách có ý nghĩa. Lĩnh vực phụ này của AI tập trung vào sự tương tác giữa máy tính và con người sử dụng ngôn ngữ tự nhiên, nhằm đọc, giải mã và tạo ra sự hiểu biết về ngôn ngữ con người một cách có giá trị.

Nguyên tắc cơ bản của NLP nằm trong khả năng của nó để xử lý và phân tích lượng lớn dữ liệu ngôn ngữ tự nhiên. Việc phân tích này không chỉ giới hạn ở việc hiểu từ ngữ trong một ý nghĩa字面 mà còn mở rộng đến việc nắm bắt ngữ cảnh, cảm xúc và thậm chí những sắc thái ngụ ý trong ngôn ngữ. Bằng cách tận dụng NLP, các hệ thống AI có thể thực hiện một loạt các nhiệm vụ, từ dịch và phân tích cảm xúc đến các tương tác phức tạp hơn như các tác nhân trò chuyện.

Trung tâm của sự tiến bộ này trong NLP là sự phát triển của các mạng nơ-ron nhân tạo, lấy cảm hứng từ các nơ-ron sinh học trong não bộ con người. Những mạng này mô phỏng cách các nơ-ron con người truyền tín hiệu điện, xử lý thông tin thông qua các nút kết nối. Kiến trúc này cho phép các mạng nơ-ron học hỏi từ dữ liệu đầu vào và cải thiện theo thời gian, giống như não bộ con người học hỏi từ kinh nghiệm.

Sự kết nối giữa các mạng nơ-ron nhân tạo và nơ-ron sinh học là một thành phần quan trọng trong việc phát triển khả năng ngôn ngữ của AI. Bằng cách mô hình hóa các quá trình nơ-ron liên quan đến việc hiểu và sản xuất ngôn ngữ con người, các nhà nghiên cứu AI đang tạo nền tảng cho các hệ thống có thể xử lý ngôn ngữ theo cách phản ánh các chức năng nhận thức của con người. Nghiên cứu của UNIGE thể hiện cách tiếp cận này, sử dụng các mô hình mạng nơ-ron tiên tiến để mô phỏng và sao chép sự tương tác phức tạp giữa việc hiểu ngôn ngữ và thực hiện nhiệm vụ vốn có trong nhận thức con người.

Cách tiếp cận của UNIGE đối với giao tiếp AI

Đội ngũ của Đại học Geneva đã tìm cách tạo ra một mạng nơ-ron nhân tạo phản ánh các khả năng nhận thức của con người. Chìa khóa là để phát triển một hệ thống không chỉ có khả năng hiểu ngôn ngữ mà còn sử dụng nó để truyền đạt các nhiệm vụ đã học. Cách tiếp cận của họ bắt đầu với một mô hình nơ-ron nhân tạo hiện có, S-Bert, nổi tiếng với khả năng hiểu ngôn ngữ.

Chiến lược của nhóm UNIGE liên quan đến việc kết nối S-Bert, bao gồm 300 triệu nơ-ron được đào tạo trước trong việc hiểu ngôn ngữ, với một mạng nơ-ron nhỏ hơn và đơn giản hơn. Mạng nơ-ron nhỏ hơn này được giao nhiệm vụ sao chép các khu vực cụ thể của não bộ con người liên quan đến việc xử lý và sản xuất ngôn ngữ – khu vực Wernicke và khu vực Broca, tương ứng. Khu vực Wernicke trong não bộ đóng vai trò quan trọng trong việc hiểu ngôn ngữ, trong khi khu vực Broca đóng vai trò quan trọng trong việc sản xuất ngôn ngữ và xử lý ngôn ngữ.

Sự kết hợp của hai mạng nơ-ron này nhằm mục đích mô phỏng sự tương tác phức tạp giữa hai khu vực não bộ này. Ban đầu, mạng nơ-ron kết hợp được đào tạo để mô phỏng khu vực Wernicke, tinh chỉnh khả năng nhận thức và diễn giải ngôn ngữ. Sau đó, nó đã trải qua quá trình đào tạo để sao chép các chức năng của khu vực Broca, cho phép sản xuất và diễn đạt ngôn ngữ. Điều đáng chú ý là toàn bộ quá trình này được thực hiện bằng cách sử dụng các máy tính xách tay thông thường, chứng tỏ sự dễ tiếp cận và khả năng mở rộng của mô hình.

Thí nghiệm và ý nghĩa của nó

Thí nghiệm liên quan đến việc cung cấp hướng dẫn viết bằng tiếng Anh cho AI, sau đó AI phải thực hiện các nhiệm vụ được chỉ định. Các nhiệm vụ này thay đổi từ các hành động đơn giản như chỉ vào một vị trí trong phản ứng với một kích thích, đến các hành động phức tạp hơn như phân biệt và phản ứng với các tương phản tinh vi trong các kích thích hình ảnh.

Mô hình này mô phỏng ý định của chuyển động hoặc chỉ, bắt chước phản ứng của con người đối với các nhiệm vụ này. Đặc biệt, sau khi nắm vững các nhiệm vụ này, AI có khả năng mô tả chúng bằng ngôn ngữ cho một mạng nơ-ron thứ hai, một bản sao của mạng nơ-ron đầu tiên. Mạng nơ-ron thứ hai, sau khi nhận được hướng dẫn, đã thành công trong việc sao chép các nhiệm vụ.

Thành tựu này đánh dấu lần đầu tiên hai hệ thống AI giao tiếp với nhau hoàn toàn thông qua ngôn ngữ, một cột mốc trong sự phát triển của AI. Khả năng của một AI để hướng dẫn một AI khác trong việc hoàn thành các nhiệm vụ thông qua giao tiếp ngôn ngữ alone mở ra những chân trời mới trong sự tương tác và hợp tác của AI.

Triển vọng cho Robot và hơn thế nữa

Sự đổi mới này có tác động đáng kể đến lĩnh vực robot và mở rộng đến các lĩnh vực khác. Các ứng dụng tiềm năng của công nghệ này trong robot là đặc biệt đầy hứa hẹn. Các robot hình người, được trang bị các mạng nơ-ron tiên tiến này, có thể hiểu và thực hiện các hướng dẫn phức tạp, tăng cường chức năng và tự chủ của chúng. Khả năng này là rất quan trọng đối với các robot được thiết kế cho các nhiệm vụ đòi hỏi sự thích nghi và học hỏi, chẳng hạn như trong chăm sóc sức khỏe, sản xuất và hỗ trợ cá nhân.

Hơn nữa, ý nghĩa của công nghệ này mở rộng ra ngoài robot. Trong các lĩnh vực như dịch vụ khách hàng, giáo dục và chăm sóc sức khỏe, các hệ thống AI với khả năng giao tiếp và học hỏi được cải thiện có thể cung cấp các dịch vụ cá nhân hóa và hiệu quả hơn. Sự phát triển của các mạng nơ-ron phức tạp hơn, dựa trên mô hình của UNIGE, mở ra cơ hội cho việc tạo ra các hệ thống AI không chỉ hiểu ngôn ngữ con người mà còn tương tác theo cách phản ánh các quá trình nhận thức của con người, dẫn đến các trải nghiệm người dùng tự nhiên và trực quan hơn.

Sự tiến bộ này trong giao tiếp AI gợi ý về một tương lai nơi khoảng cách giữa trí tuệ con người và máy móc thu hẹp lại, dẫn đến những tiến bộ có thể định nghĩa lại sự tương tác của chúng ta với công nghệ. Nghiên cứu của UNIGE, do đó, không chỉ là một minh chứng cho các khả năng đang phát triển của AI mà còn là một tín hiệu cho các cuộc khám phá tương lai trong lĩnh vực nhận thức và giao tiếp nhân tạo.

Unite.AI