Trí tuệ nhân tạo

Làm thế nào LLM đang buộc chúng ta phải định nghĩa lại trí tuệ

Đã xuất bản 7 tháng 9, 2025

Đã cập nhật 18 tháng 5, 2026

Dr. Tehseen Zia

Có một câu nói cổ xưa: Nếu nó trông như một con vịt, bơi như một con vịt và kêu như một con vịt, thì nó có thể là một con vịt. Cách suy luận đơn giản này, thường được liên kết với nhà thơ Indiana James Whitcomb Riley, đã định hình cách chúng ta nghĩ về trí tuệ nhân tạo trong nhiều thập kỷ. Ý tưởng rằng hành vi là đủ để xác định trí tuệ đã truyền cảm hứng cho trò chơi “Imitation Game” nổi tiếng của Alan Turing, hiện được gọi là Trò chơi Turing.

Turing đã đề xuất rằng nếu một con người không thể phân biệt liệu họ đang trò chuyện với một máy hoặc một con người khác, thì máy có thể được coi là thông minh. Cả thử nghiệm vịt và thử nghiệm Turing đều gợi ý rằng điều quan trọng không phải là những gì nằm bên trong một hệ thống, mà là cách nó hành xử. Trong nhiều thập kỷ, thử nghiệm này đã hướng dẫn sự tiến bộ trong lĩnh vực trí tuệ nhân tạo. Nhưng với sự xuất hiện của các mô hình ngôn ngữ lớn (LLM), tình hình đã thay đổi. Những hệ thống này có thể tạo ra văn bản trôi chảy, tham gia vào các cuộc trò chuyện và giải quyết các nhiệm vụ theo cách cảm giác giống như con người. Câu hỏi không còn là liệu máy móc có thể bắt chước cuộc trò chuyện của con người, mà là liệu sự bắt chước này có phải là trí tuệ thực sự hay không. Nếu một hệ thống có thể viết như chúng ta, suy nghĩ như chúng ta và thậm chí tạo ra như chúng ta, thì chúng ta nên gọi nó là thông minh? Hay là hành vi alone không còn đủ để đo lường trí tuệ?

Sự tiến hóa của trí tuệ máy móc

Các mô hình ngôn ngữ lớn đã thay đổi cách chúng ta nghĩ về trí tuệ nhân tạo. Những hệ thống này, từng bị giới hạn trong việc tạo ra các phản hồi văn bản cơ bản, hiện có thể giải quyết các vấn đề logic, viết mã máy tính, soạn thảo câu chuyện và thậm chí hỗ trợ các nhiệm vụ sáng tạo như viết kịch bản. Một trong những phát triển quan trọng trong tiến trình này là khả năng của chúng trong việc giải quyết các vấn đề phức tạp thông qua suy luận bước-by-bước, một phương pháp được gọi là suy luận dây chuyền. Bằng cách chia nhỏ một vấn đề thành các phần nhỏ hơn, một LLM có thể giải quyết các vấn đề toán học hoặc các câu đố logic theo cách trông giống như giải quyết vấn đề của con người. Khả năng này đã cho phép chúng đạt được hoặc thậm chí vượt qua hiệu suất của con người trên các tiêu chuẩn tiên tiến như MATH hoặc GSM8K. Hiện nay, LLM cũng sở hữu khả năng đa phương thức. Chúng có thể làm việc với hình ảnh, giải thích các bản quét y tế, giải thích các câu đố hình ảnh và mô tả các sơ đồ phức tạp. Với những tiến bộ này, câu hỏi không còn là liệu LLM có thể bắt chước hành vi của con người, mà là liệu hành vi này phản ánh sự hiểu biết thực sự.

Dấu vết của suy nghĩ giống như con người

Sự thành công của LLM đang định nghĩa lại cách chúng ta hiểu về trí tuệ. Sự tập trung đang chuyển từ việc căn chỉnh hành vi của AI với con người, như được đề xuất bởi thử nghiệm Turing, sang việc khám phá cách LLM phản ánh suy nghĩ giống như con người trong cách chúng xử lý thông tin (tức là suy nghĩ giống như con người thực sự). Ví dụ, trong một nghiên cứu gần đây, các nhà nghiên cứu đã so sánh các hoạt động nội bộ của các mô hình AI với hoạt động của não bộ con người. Nghiên cứu đã tìm thấy rằng LLM với hơn 70 tỷ tham số, không chỉ đạt được độ chính xác của con người mà còn tổ chức thông tin nội bộ theo cách phù hợp với các mẫu não bộ của con người.

Khi cả con người và mô hình AI làm việc trên các nhiệm vụ nhận dạng mẫu, các bản quét não cho thấy các mẫu hoạt động tương tự ở những người tham gia và các mẫu tính toán tương ứng trong các mô hình AI. Các mô hình đã nhóm các khái niệm trừu tượng trong các lớp nội bộ theo cách phù hợp trực tiếp với hoạt động sóng não của con người. Điều này gợi ý rằng việc suy nghĩ thành công có thể đòi hỏi các cấu trúc tổ chức tương tự, dù là trong các hệ thống sinh học hay nhân tạo.

Tuy nhiên, các nhà nghiên cứu cẩn thận lưu ý về những hạn chế của công việc này. Nghiên cứu liên quan đến một số lượng nhỏ các tham gia con người, và con người và máy móc tiếp cận các nhiệm vụ khác nhau. Con người làm việc với các mẫu hình ảnh trong khi các mô hình AI xử lý các mô tả văn bản. Sự tương quan giữa xử lý của con người và máy móc là thú vị, nhưng nó không chứng minh rằng máy móc hiểu các khái niệm theo cách giống như con người.

Cũng có những sự khác biệt rõ ràng về hiệu suất. Trong khi các mô hình AI tốt nhất đạt được độ chính xác của con người trên các mẫu đơn giản, chúng cho thấy sự giảm hiệu suất rõ rệt hơn trên các nhiệm vụ phức tạp nhất so với những người tham gia con người. Điều này gợi ý rằng mặc dù có sự tương đồng trong tổ chức, vẫn có thể có những sự khác biệt cơ bản trong cách con người và máy móc xử lý các khái niệm trừu tượng khó.

Quan điểm hoài nghi

Mặc dù những phát hiện ấn tượng này, một lập luận mạnh mẽ cho rằng LLM không gì khác hơn là một người bắt chước rất giỏi. Quan điểm này đến từ thí nghiệm tư duy ” Phòng Trung Quốc” của nhà triết học John Searle, minh họa tại sao hành vi có thể không bằng với sự hiểu biết.

Trong thí nghiệm tư duy này, Searle yêu cầu chúng ta tưởng tượng một người bị khóa trong một phòng và chỉ nói được tiếng Anh. Người đó nhận được các ký tự Trung Quốc và sử dụng một cuốn sách quy tắc tiếng Anh để xử lý các ký tự này và tạo ra các phản hồi. Từ bên ngoài phòng, các phản hồi của anh ta trông giống như những phản hồi của một người nói tiếng Trung Quốc bản địa. Tuy nhiên, Searle lập luận rằng người đó không hiểu gì về tiếng Trung Quốc. Anh ta chỉ tuân theo các quy tắc mà không có sự hiểu biết thực sự.

Các nhà phê bình áp dụng logic tương tự cho LLM. Họ lập luận rằng những hệ thống này là “vẹt ngẫu nhiên” tạo ra phản hồi dựa trên các mẫu thống kê trong dữ liệu đào tạo của chúng, chứ không phải dựa trên sự hiểu biết thực sự. Thuật ngữ “ngẫu nhiên” ám chỉ đến bản chất xác suất của chúng, trong khi “vẹt” nhấn mạnh hành vi bắt chước của chúng mà không có sự hiểu biết thực sự.

Một số hạn chế kỹ thuật của LLM cũng hỗ trợ lập luận này. LLM thường tạo ra “ảo giác“; các phản hồi trông có vẻ hợp lý nhưng hoàn toàn sai, lừa đảo và vô nghĩa. Điều này xảy ra vì chúng chọn các từ có khả năng thống kê cao hơn là tham khảo một cơ sở kiến thức nội bộ hoặc hiểu sự thật và sai lầm. Những mô hình này cũng tái tạo các lỗi và thiên vị của con người. Chúng bị nhầm lẫn bởi thông tin không liên quan mà con người sẽ dễ dàng bỏ qua. Chúng thể hiện các khuôn mẫu chủng tộc và giới tính vì chúng được đào tạo trên dữ liệu chứa các thiên vị này. Một hạn chế khác được tiết lộ là “thiên vị vị trí”, nơi các mô hình nhấn mạnh quá mức thông tin ở đầu hoặc cuối các tài liệu dài trong khi bỏ qua nội dung ở giữa. Hiện tượng “mất trong giữa” này cho thấy rằng những hệ thống này xử lý thông tin rất khác so với con người, những người có thể duy trì sự chú ý trên toàn bộ tài liệu.

Những hạn chế này làm nổi bật một thách thức trung tâm: trong khi LLM giỏi trong việc nhận ra và tái tạo các mẫu ngôn ngữ, điều này không có nghĩa là chúng thực sự hiểu ý nghĩa hoặc ngữ cảnh thế giới thực. Chúng hoạt động tốt trong việc xử lý cú pháp nhưng vẫn còn hạn chế khi nói đến ngữ nghĩa.

Cái gì được coi là trí tuệ?

Cuối cùng, cuộc tranh luận này phụ thuộc vào cách chúng ta định nghĩa trí tuệ. Nếu trí tuệ là khả năng tạo ra ngôn ngữ mạch lạc, giải quyết vấn đề và thích nghi với các tình huống mới, thì LLM đã đáp ứng tiêu chuẩn này. Tuy nhiên, nếu trí tuệ đòi hỏi sự tự nhận thức, hiểu biết thực sự hoặc kinh nghiệm chủ quan, thì những hệ thống này vẫn còn thiếu.

Khó khăn là chúng ta thiếu một cách rõ ràng và khách quan để đo lường các phẩm chất như hiểu biết hoặc ý thức. Trong cả con người và máy móc, chúng ta suy diễn chúng từ hành vi. Thử nghiệm vịt và thử nghiệm Turing từng cung cấp những câu trả lời thanh lịch, nhưng trong thời đại của LLM, chúng có thể không còn đủ nữa. Khả năng của chúng buộc chúng ta phải xem xét lại những gì thực sự được coi là trí tuệ và liệu các định nghĩa truyền thống của chúng ta có đang theo kịp với thực tế công nghệ.

Kết luận

Các mô hình ngôn ngữ lớn thách thức cách chúng ta định nghĩa trí tuệ nhân tạo. Chúng có thể bắt chước suy nghĩ, tạo ra ý tưởng và thực hiện các nhiệm vụ từng được coi là duy nhất của con người. Tuy nhiên, chúng thiếu sự nhận thức và nền tảng hình thành suy nghĩ giống như con người thực sự. Sự trỗi dậy của chúng buộc chúng ta phải đặt câu hỏi không chỉ về việc liệu máy móc có hành động thông minh hay không, mà còn về ý nghĩa thực sự của trí tuệ.