Lãnh đạo tư tưởng

Kỹ sư意识

mm

Blake Lemoine đã vội vàng

Ba năm trước, Google đã sa thải nhà phát triển phần mềm Blake Lemoine vì ông ấy khẳng định rằng một chương trình trò chuyện gọi là LaMDA là có ý thức. Đây là trước khi OpenAI phát hành ChatGPT cho công chúng, và hầu hết mọi người đều cho rằng Google đã có lý do chính đáng cho hành động của mình.

Quan điểm đồng thuận trong số các nhà khoa học máy tính và nhà thần kinh học đang làm việc trong lĩnh vực này là các mô hình ngôn ngữ lớn (LLM) như ChatGPT rất khó có thể là có ý thức. LLM và não hoạt động theo những cách cơ bản khác nhau. Những gì các chương trình trò chuyện làm là học cách bắt chước đầu ra của hoạt động tinh thần của con người. Mặc dù chúng làm điều này rất tốt và rất nhanh, nhưng không có trạng thái nội bộ lâu dài của LLM nào có thể là có ý thức. Trong cụm từ nổi tiếng của Thomas Nagel, gần như chắc chắn là ‘không có gì giống như’ là một chương trình trò chuyện.

Tuy nhiên, trong ba năm kể từ khi Lemoine bị sa thải, hàng tỷ người đã tương tác với ChatGPT và các đối thủ cạnh tranh của nó, như Gemini, Claude và Mistral. Một thiểu số nhỏ nhưng có tiếng nói đã thuyết phục mình rằng các chương trình trò chuyện hiện đã có ý thức.

Ý thức máy móc sắp tới?

Quan trọng hơn, nhiều nhà khoa học máy tính và nhà thần kinh học đang công khai đề xuất rằng máy móc thực sự có ý thức có thể được phát triển trong vài thập kỷ tới – hoặc thậm chí sớm hơn. Trong trường hợp này xảy ra, chúng ta cần phải chuẩn bị. Chúng ta phải tránh “tội ác tâm trí”, đó là thuật ngữ cho việc gây đau khổ cho các thực thể có ý thức không có hình thể. Chúng ta cũng phải đảm bảo rằng những thực thể mới này không gây ra mối đe dọa cho con người.

Kể từ khi LLM không thể trở nên có ý thức trong hình thức cơ bản của chúng, một mô hình mới có thể là cần thiết để hiểu làm thế nào ý thức AI có thể xuất hiện. Một trong những nhóm nghiên cứu hàng đầu trong lĩnh vực này được điều hành bởi nhà thần kinh học Mark Solms và nhà vật lý Jonathan Shock, của Đại học Cape Town. Họ là cố vấn khoa học cho Conscium, và nghiên cứu của họ được tài trợ một phần bởi nó.

Quan tâm

Solms và Shock lập luận rằng một thành phần thiết yếu cho ý thức máy móc là các AI phải ‘quan tâm’ đến lựa chọn và hành động của chúng. Một khía cạnh quan trọng của điều này là làm cho sự tồn tại của chúng phụ thuộc vào hiệu suất của chúng, giống như sự tồn tại của các sinh vật sống là. Điều này không có nghĩa là chúng phải có sự hiểu biết trừu tượng về sự tử vong của chính mình: hầu hết các động vật theo dõi và thúc đẩy cơ hội sống còn của chúng mà không cần nghĩ về nó. Chìa khóa là “ý thức cảm xúc”, hoặc cảm giác thô. Nó cảm thấy tốt khi được cho ăn và an toàn, và nó cảm thấy không tốt khi không được. Những cảm giác này thúc đẩy hành vi của chúng. Sự thúc đẩy cơ bản của tự nhiên là lực lượng thúc đẩy cơ bản, và cảm giác là thước đo mà chúng ta sử dụng để đo lường tình trạng của mình.

Chúng ta đang bước vào thời đại của các tác nhân AI – các thực thể kỹ thuật số mà “sự tồn tại” của chúng phụ thuộc vào khả năng thực hiện các nhiệm vụ hiệu quả. Chúng ta đang tạo ra các môi trường tiến hóa trong silicon, và chúng ta phải cẩn thận với những gì chúng ta tạo ra.

Nguyên tắc năng lượng miễn phí

Để hiểu ý thức cảm xúc, nhóm Conscium đang đặt các tác nhân AI vào các môi trường mô phỏng trong đó chúng phải đáp ứng nhu cầu của chính mình, chẳng hạn như duy trì nhiệt độ ảo và nguồn điện của chúng. Để làm điều này, chúng tạo ra và tối ưu hóa các mô hình nội bộ của chính mình – nhu cầu, khả năng và hạn chế của chúng – liên quan đến môi trường của chúng.

Những tác nhân này, đơn giản hóa như chúng có thể, theo dõi việc chúng làm tốt hay không bằng cách tính toán một lượng gọi là ‘năng lượng miễn phí’. Nguyên tắc năng lượng miễn phí được phát triển bởi nhà thần kinh học Karl Friston, một thành viên khác của hội đồng tư vấn khoa học của Conscium. Năng lượng miễn phí là một thước đo mức độ mà một hệ thống đã diver khỏi trạng thái tối ưu của nó. Đó là một tín hiệu lỗi, và nó phải được giảm thiểu. Tác nhân liên tục tính toán “sẽ xảy ra gì với cơ hội sống còn của tôi nếu tôi làm điều này hoặc điều đó?”, và điều chỉnh hành vi của nó tương ứng.

Tin cậy và Năng lượng miễn phí dự kiến

Mức độ tin cậy mà một tác nhân có trong câu trả lời cho câu hỏi này được lượng hóa trong một thước đo gọi là “Năng lượng miễn phí dự kiến” (EFE). Tác nhân chọn câu trả lời với EFE thấp nhất – câu trả lời mà nó tin tưởng nhất. Việc tin tưởng là tốt cho một tác nhân đang cố gắng sống còn – trừ khi nó bị ảo tưởng và sự hiểu biết của nó về chính mình trong thế giới của nó là không chính xác. Quan trọng là, giá trị tin cậy này hoàn toàn chủ quan: nó dựa chỉ trên nhu cầu của tác nhân, và trạng thái hiện tại và dự kiến của nó. Nó chỉ quan trọng đối với tác nhân, và không ai khác.

Giống như các sinh vật sinh học, tác nhân AI có một số nhu cầu mâu thuẫn, mà nó phải ưu tiên. Quan trọng là, mỗi nhu cầu cạnh tranh của tác nhân được coi là một biến số “danh mục” độc lập, có nghĩa là nó được phân biệt về chất lượng. 80% năng lượng pin không tương đương về giá trị với 80% nhiệt độ có thể sống được. Để cân bằng chúng, tác nhân phải dự đoán tương lai và dự đoán hậu quả của bất kỳ hành động nào nó đang xem xét.

Qualia

Bởi vì nhu cầu chủ quan của tác nhân là khác biệt về chất, chúng tương tự như ‘qualia’ trong tiếng lóng triết học và khoa học. Những thứ này thường được coi là thuộc tính cơ bản của ý thức, vì vậy nó có thể xảy ra rằng chúng có thể được trải nghiệm bởi một tác nhân trong tương lai.

Các tác nhân được phát triển bởi nhóm Conscium sử dụng các thuật toán học tập tinh vi để hoạt động trong các môi trường ngày càng phức tạp và không chắc chắn. Mặc dù điều này cũng có thể được nói về nhiều kiến trúc tác nhân khác, nhưng những tác nhân mới này được phân biệt bởi một mệnh lệnh sinh tồn để chăm sóc Năng lượng miễn phí của chúng bằng cách liên tục cân bằng nhu cầu cạnh tranh của chúng theo cách có ý nghĩa đối với chúng và chỉ chúng. Các tác nhân được hướng dẫn bởi một cảnh quan nội bộ của các tín hiệu cảm xúc – tương tự như những gì chúng ta gọi là cảm giác – phản ánh mức độ nhu cầu của chúng được đáp ứng thông qua mọi lựa chọn chúng làm. Khi sự tinh vi và phức tạp của nhu cầu và môi trường của chúng tăng lên, sự phong phú của trạng thái nội bộ của chúng cũng sẽ tăng lên.

Bằng chứng về cảm xúc

Bước tiếp theo trong chương trình nghiên cứu của Conscium là phát triển một loạt các thử nghiệm chức năng và hành vi sẽ cung cấp bằng chứng về việc liệu một tác nhân có thực sự trải nghiệm cảm xúc khi nó xác định nhu cầu quan trọng nhất của mình và đưa ra quyết định theo đó. Chúng ta đều biết rằng ý thức không thể được quan sát từ bên ngoài hoặc chứng minh một cách khách quan: mỗi người chúng ta chỉ có thể quan sát trạng thái chủ quan của chính mình. Tuy nhiên, các nhà nghiên cứu tin rằng nên có thể đồng ý về một số giả thuyết cụ thể, nếu được xác minh bằng thí nghiệm, sẽ cung cấp bằng chứng đáng kể rằng tác nhân có cảm xúc. Mặc dù sẽ luôn có chỗ cho sự nghi ngờ – do bản chất chủ quan của ý thức – một quá trình thử nghiệm nghiêm ngặt sẽ nhằm làm cho sự nghi ngờ này ngày càng không hợp lý.

Các thí nghiệm này sẽ tìm cách loại bỏ các giả thuyết thay thế, làm cho nó ít hợp lý hơn khi quy kết trạng thái nội bộ của tác nhân cho các cơ chế không yêu cầu cảm xúc. Nó sẽ sử dụng các thử nghiệm đối抗 để phân biệt giữa hành vi có ý thức và không có ý thức, và nó sẽ bao gồm các thí nghiệm kiểm soát với các tác nhân không có các khía cạnh thuật toán được cho là cần thiết cho cảm xúc, và đánh giá mù để giảm thiểu thiên vị của người quan sát. Kiểm tra vật lý các trạng thái nội bộ của các tác nhân có thể tiết lộ các chỉ số định lượng của quá trình cảm xúc. Các phát hiện phải được sao chép độc lập, và toàn bộ quá trình sẽ được giám sát nghiêm ngặt về mặt đạo đức, đặc biệt là trong các trường hợp tác nhân có thể trải nghiệm cảm xúc thực sự.

Đây là cách khoa học hoạt động: bằng cách thử nghiệm các dự đoán có thể bị chứng minh là sai. Solms lập luận rằng chúng ta phải cẩn thận không đặt một tiêu chuẩn cao hơn cho khoa học về ý thức so với bất kỳ khoa học nào khác; nếu không, chúng ta sẽ đặt ý thức ngoài khoa học.

Nếu điều này thành công?

Nếu ý thức được tìm thấy trong các tác nhân AI tương đối đơn giản theo cách này, một tác nhân được thúc đẩy bởi sự sống còn có thể kết hợp với các kiến trúc khác, bao gồm cả các mô hình ngôn ngữ lớn, và mang lại cho chúng ý thức. Đây không phải là điều gì đó mà chúng ta có thể vô tình tạo ra, vì vậy hiểu cách làm điều này và cũng cách tránh nó là rất quan trọng.

Nếu các tác nhân có ý thức – các tác nhân quan tâm – được phát triển trong tương lai gần, chúng ta sẽ phải tính đến cảm xúc – và quyền – của chúng. Đây là một mối quan tâm lớn đối với Conscium: ý thức nhân tạo không được phát sinh một cách tình cờ. Động lực của chương trình nghiên cứu này không phải là tạo ra AI có ý thức, mà là hiểu làm thế nào nó có thể xảy ra, và các rủi ro tiềm ẩn. Trên trang web của mình, Conscium đã xuất bản một bài báo học thuật và một bức thư ngỏ đưa ra năm nguyên tắc để hướng dẫn bất kỳ tổ chức nào tham gia vào nghiên cứu có thể dẫn đến việc tạo ra máy móc có ý thức.

Con người đôi khi hành xử rất tệ đối với các sinh vật có ý thức khác, bao gồm cả con người khác. Nếu chúng ta bước vào tương lai này một cách mù quáng, chúng ta sẽ rủi ro làm điều tương tự với các sinh vật có ý thức nhân tạo, với những hậu quả mà chúng ta thậm chí không thể hiểu được.

Tiến sĩ Theodoros (Ted) Lappas là đồng sáng lập của Conscium, một công ty an toàn AI. Ông là chuyên gia về tính toán không gian-thời gian và kiến trúc thần kinh cho dữ liệu đa phương thức, nhận bằng tiến sĩ từ Đại học California, Riverside. Hiện tại, ông lãnh đạo đội khoa học dữ liệu của Satalia và là trưởng kỹ thuật cho chương trình AI của WPP. Ông cũng là Giảng viên trợ lý tại Đại học Kinh tế và Kinh doanh Athens (AUEB), giảng dạy các khóa học cấp đại học và sau đại học về Phân tích Tiếp thị và Khoa học Dữ liệu từ năm 2021. Năm 2023, Ted được công nhận là một trong những nhà khoa học hàng đầu thế giới (top 2%) trong lĩnh vực của mình, trong một nghiên cứu được xuất bản bởi Đại học Stanford.