Kết nối với chúng tôi

Khi các tác nhân AI bắt đầu xây dựng AI: Sự bùng nổ trí tuệ đệ quy mà không ai lường trước được

Trí tuệ nhân tạo

Khi các tác nhân AI bắt đầu xây dựng AI: Sự bùng nổ trí tuệ đệ quy mà không ai lường trước được

mm

Trong nhiều thập kỷ, trí tuệ nhân tạo đã phát triển một cách cẩn trọng, chủ yếu là theo những bước tuyến tính. Các nhà nghiên cứu xây dựng mô hình. Các kỹ sư cải thiện hiệu suất. Các tổ chức triển khai hệ thống để tự động hóa các nhiệm vụ cụ thể. Mỗi cải tiến đều phụ thuộc rất nhiều vào thiết kế và sự giám sát của con người. Mô hình đó hiện đang bị phá vỡ. Một cách lặng lẽ nhưng dứt khoát, các hệ thống AI đang vượt qua một ngưỡng mà chúng không còn chỉ là những công cụ do con người tạo ra nữa. Chúng đang trở thành những người kiến ​​tạo thực thụ.

Các tác nhân AI đang bắt đầu thiết kế, đánh giá và triển khai các hệ thống AI khác. Khi làm như vậy, chúng tạo ra các vòng phản hồi, trong đó mỗi thế hệ cải thiện thế hệ trước. Sự thay đổi này không được công bố rầm rộ bằng những tiêu đề giật gân. Nó diễn ra thông qua các bài nghiên cứu, công cụ dành cho nhà phát triển và nền tảng doanh nghiệp. Tuy nhiên, ý nghĩa của nó là vô cùng sâu sắc. Khi trí tuệ có thể tự cải thiện một cách đệ quy, sự tiến bộ không còn tuân theo thời gian biểu hay trực giác của con người nữa. Nó được đẩy nhanh hơn.

Bài viết này khám phá cách chúng ta đã đến được thời điểm này, tại sao trí tuệ đệ quy lại quan trọng và tại sao xã hội lại chưa chuẩn bị kỹ lưỡng cho điều đó. Sự bùng nổ trí tuệ, từng là một ý tưởng triết học, giờ đây đã trở thành một thách thức kỹ thuật cụ thể.

Sự tiến hóa của sự bùng nổ trí tuệ

Ý tưởng rằng một cỗ máy có thể tự nâng cao trí thông minh của mình đã xuất hiện trước cả kỷ nguyên máy tính hiện đại. Vào đầu những năm 1960, nhà toán học người Anh I.J. Good đã đưa ra nhận định này. giới thiệu khái niệm về một “vụ nổ tình báoLý luận của ông là: Nếu một cỗ máy trở nên đủ thông minh để tự cải tiến thiết kế của mình, dù chỉ một chút, thì phiên bản được cải tiến đó sẽ tốt hơn trong việc cải tiến phiên bản tiếp theo. Chu kỳ này có thể lặp lại nhanh chóng, dẫn đến sự phát triển vượt xa sự hiểu biết hoặc kiểm soát của con người. Vào thời điểm đó, đây là một thí nghiệm tư tưởng triết học, được thảo luận nhiều hơn về mặt lý thuyết hơn là thực tiễn.

Vài thập kỷ sau, ý tưởng này đã có cơ sở kỹ thuật vững chắc nhờ công trình nghiên cứu của nhà khoa học máy tính Jürgen Schmidhuber. Đề xuất của ông về... Máy Gödel Mô tả một hệ thống có khả năng viết lại bất kỳ phần nào trong mã của chính nó, miễn là nó có thể chứng minh một cách chính thức rằng sự thay đổi đó sẽ cải thiện hiệu suất trong tương lai. Không giống như các hệ thống học tập truyền thống, điều chỉnh các tham số trong các kiến ​​trúc cố định, Máy Gödel có thể thay đổi các quy tắc học tập của chính nó. Mặc dù vẫn còn mang tính lý thuyết, công trình này đã định hình lại sự bùng nổ trí tuệ như một điều gì đó có thể được nghiên cứu, chính thức hóa và cuối cùng là xây dựng.

Bước chuyển đổi cuối cùng từ lý thuyết sang thực tiễn đến cùng với sự trỗi dậy của các tác nhân AI hiện đại. Các hệ thống này không chỉ đơn thuần tạo ra kết quả đầu ra để đáp ứng các yêu cầu. Chúng lập kế hoạch, suy luận, hành động, quan sát kết quả và điều chỉnh hành vi theo thời gian. Với sự xuất hiện của các kiến ​​trúc tác nhân, sự bùng nổ trí tuệ đã chuyển từ triết học sang kỹ thuật. Các thí nghiệm ban đầu, chẳng hạn như... Máy Darwin Gödel Các khái niệm này gợi ý về những hệ thống phát triển thông qua quá trình tự cải tiến lặp đi lặp lại. Điều làm nên sự khác biệt ở thời điểm này chính là tính đệ quy. Khi một tác nhân AI có thể tạo ra và tinh chỉnh các tác nhân khác, học hỏi từ mỗi lần lặp lại, sự cải tiến sẽ được nhân lên theo cấp số nhân.

Khi các tác nhân AI bắt đầu xây dựng AI

Hai xu hướng chính đang thúc đẩy sự chuyển đổi này. Thứ nhất là sự trỗi dậy của các hệ thống AI tác nhân. Các hệ thống này theo đuổi mục tiêu trong thời gian dài, chia nhỏ nhiệm vụ thành các bước, phối hợp các công cụ và thích ứng dựa trên phản hồi. Chúng không phải là các mô hình tĩnh. Chúng là các quy trình.

Xu hướng thứ hai là học máy tự động. Hiện nay đã có những hệ thống có thể thiết kế kiến ​​trúc, tinh chỉnh siêu tham số, tạo ra các quy trình huấn luyện và thậm chí đề xuất các thuật toán mới với sự can thiệp tối thiểu của con người. Khi khả năng suy luận của tác nhân kết hợp với việc tạo mô hình tự động, AI sẽ có khả năng tự xây dựng AI.

Đây không còn là một kịch bản giả định nữa. Các tác nhân tự chủ như... AutoGPT Minh họa cách một mục tiêu duy nhất có thể kích hoạt các chu kỳ lập kế hoạch, thực hiện, đánh giá và sửa đổi. Trong môi trường nghiên cứu, các hệ thống như... Nhà khoa học phiên bản 2 của Sakana AIAlphaEvolve của DeepMind Trình bày cách các tác nhân thiết kế thí nghiệm, đề xuất thuật toán và tinh chỉnh giải pháp thông qua phản hồi lặp đi lặp lại. tìm kiếm kiến ​​trúc thần kinhCác hệ thống AI hiện nay đã khám phá ra những cấu trúc mô hình có thể sánh ngang hoặc vượt trội so với các mạng lưới do con người thiết kế. Những hệ thống này không chỉ giải quyết vấn đề mà còn cải thiện các cơ chế được sử dụng để giải quyết vấn đề. Mỗi chu kỳ tạo ra những công cụ tốt hơn, từ đó tạo ra những chu kỳ tốt hơn.

Để mở rộng quy mô quy trình này, các nhà nghiên cứu và công ty ngày càng dựa vào... dàn nhạc Kiến trúc hệ thống dựa trên một tác nhân trung tâm (meta-agent) nhận một mục tiêu cấp cao. Nó phân rã nhiệm vụ thành các vấn đề con, tạo ra các tác nhân chuyên biệt để giải quyết chúng, đánh giá kết quả bằng dữ liệu thực tế và tích hợp các kết quả tốt nhất. Các thiết kế kém hiệu quả sẽ bị loại bỏ và các thiết kế thành công sẽ được củng cố. Theo thời gian, tác nhân điều phối sẽ trở nên giỏi hơn trong việc tự thiết kế các tác nhân.

Mặc dù thời gian chính xác khi nào các tác nhân AI sẽ hoàn toàn xây dựng và cải thiện các hệ thống AI khác vẫn chưa chắc chắn, nhưng các hướng nghiên cứu và đánh giá hiện tại từ các nhà lãnh đạo hàng đầu cho thấy điều ngược lại. Nhà nghiên cứu AIcác học viên Điều này cho thấy quá trình chuyển đổi đang diễn ra nhanh hơn nhiều người dự đoán. Các phiên bản ban đầu, còn hạn chế của khả năng này đã xuất hiện trong các phòng nghiên cứu và triển khai doanh nghiệp, nơi các chuyên gia đang bắt đầu thiết kế, đánh giá và tinh chỉnh các hệ thống khác với sự tham gia hạn chế của con người.

Sự xuất hiện của tính khó lường

Trí tuệ đệ quy đặt ra những thách thức mà tự động hóa truyền thống chưa từng gặp phải. Một trong những thách thức đó là tính không thể dự đoán được ở cấp độ hệ thống. Khi nhiều tác nhân tương tác, hành vi tập thể của chúng có thể khác xa so với ý định đằng sau thiết kế riêng lẻ của từng tác nhân. Hiện tượng này được gọi là hành vi nổi lên.

Sự xuất hiện của vấn đề không bắt nguồn từ một thành phần lỗi duy nhất, mà từ sự tương tác giữa nhiều thành phần có năng lực. Hãy xem xét các hệ thống giao dịch tự động. Mỗi tác nhân giao dịch có thể tuân theo các quy tắc hợp lý được thiết kế để tối đa hóa lợi nhuận trong phạm vi cho phép. Tuy nhiên, khi hàng nghìn tác nhân như vậy tương tác với tốc độ cao, các vòng phản hồi có thể hình thành. Phản ứng của một tác nhân có thể kích hoạt phản ứng của tác nhân khác, điều này có thể kích hoạt phản ứng khác nữa, cho đến khi hệ thống mất ổn định. Sự sụp đổ thị trường có thể xảy ra mà không cần bất kỳ tác nhân nào bị lỗi. Sự thất bại này không phải do ý đồ xấu. Nó là kết quả của sự không phù hợp giữa tối ưu hóa cục bộ và mục tiêu toàn hệ thống. Động lực tương tự cũng có thể áp dụng cho các lĩnh vực khác.

Cuộc khủng hoảng liên kết đa tác nhân

Nghiên cứu truyền thống về việc điều chỉnh trí tuệ nhân tạo tập trung vào việc điều chỉnh một mô hình duy nhất sao cho phù hợp với các giá trị của con người. Câu hỏi rất đơn giản: làm thế nào để đảm bảo hệ thống duy nhất này hoạt động theo đúng ý muốn của chúng ta? Câu hỏi đó trở nên... khó hơn đáng kể Khi hệ thống chứa hàng chục, hàng trăm hoặc hàng nghìn tác nhân tương tác. Việc đồng bộ hóa các tác nhân riêng lẻ không đảm bảo hành vi hệ thống được đồng bộ. Ngay cả khi mọi thành phần tuân theo quy tắc của nó, kết quả tổng thể vẫn có thể gây hại. Các phương pháp an toàn hiện có không phù hợp để phát hiện hoặc ngăn chặn những lỗi này.

Rủi ro bảo mật cũng gia tăng. Một tác nhân bị xâm nhập trong mạng đa tác nhân có thể làm sai lệch thông tin mà các tác nhân khác dựa vào. Một kho dữ liệu bị hỏng duy nhất có thể lan truyền hành vi sai lệch trên toàn hệ thống. Các lỗ hổng cơ sở hạ tầng đe dọa một tác nhân có thể lan rộng lên trên, đe dọa các mô hình nền tảng. Bề mặt tấn công mở rộng với mỗi tác nhân mới được thêm vào.

Trong khi đó, khoảng cách về quản trị ngày càng nới rộng. Nghiên cứu từ microsoft và các tổ chức khác nhận thấy rằng chỉ khoảng một trong mười công ty có chiến lược quản lý rõ ràng. danh tính tác nhân AI và quyền hạn. Dự kiến ​​sẽ có hơn 40 tỷ danh tính tự trị tồn tại vào cuối năm nay. Hầu hết hoạt động với quyền truy cập rộng rãi vào dữ liệu và hệ thống nhưng không có các giao thức bảo mật được áp dụng cho người dùng là con người. Các hệ thống đang phát triển nhanh chóng. Cơ chế giám sát thì không.

Mất khả năng giám sát

Rủi ro nghiêm trọng nhất do việc tự cải tiến liên tục mang lại không phải là năng lực thô, mà là sự mất dần vai trò giám sát có ý nghĩa của con người. Các tổ chức nghiên cứu hàng đầu đang tích cực phát triển các hệ thống có thể tự sửa đổi và tối ưu hóa kiến ​​trúc của chúng mà không cần hoặc cần rất ít sự can thiệp của con người. Mỗi cải tiến cho phép hệ thống tạo ra những phiên bản kế nhiệm có năng lực hơn, tạo ra một vòng phản hồi mà không có điểm nào con người còn kiểm soát được một cách đáng tin cậy.

Khi sự giám sát của con người giảm dần, hậu quả trở nên nghiêm trọng. Khi các chu kỳ cải tiến diễn ra với tốc độ máy móc, con người không còn có thể xem xét mọi thay đổi, hiểu mọi quyết định thiết kế hoặc can thiệp trước khi những sai lệch nhỏ tích tụ thành rủi ro hệ thống. Sự giám sát chuyển từ kiểm soát trực tiếp sang quan sát hồi cứu. Trong điều kiện như vậy, việc xác minh sự phù hợp trở nên khó khăn hơn và dễ bị xói mòn hơn, vì các hệ thống buộc phải duy trì mục tiêu và ràng buộc của mình thông qua các lần tự sửa đổi liên tiếp. Nếu không có các cơ chế đáng tin cậy để bảo toàn ý định xuyên suốt các lần lặp này, hệ thống có thể tiếp tục hoạt động hiệu quả trong khi âm thầm vượt ra ngoài các giá trị, ưu tiên và quản trị của con người.

Lời kết

Trí tuệ nhân tạo (AI) đã bước vào giai đoạn tự cải thiện bằng cách xây dựng những phiên bản tốt hơn của chính nó. Trí tuệ đệ quy, do tác nhân điều khiển hứa hẹn những lợi ích phi thường, nhưng cũng tiềm ẩn những rủi ro leo thang nhanh hơn khả năng giám sát, quản trị và trực giác của con người. Thách thức phía trước không phải là liệu sự chuyển đổi này có thể được ngăn chặn hay không, mà là liệu sự an toàn, sự đồng bộ và trách nhiệm giải trình có thể phát triển song song với năng lực hay không. Nếu không, sự bùng nổ trí tuệ sẽ vượt quá khả năng kiểm soát của chúng ta.

Tiến sĩ Tehseen Zia là Phó Giáo sư chính thức tại Đại học COMSATS Islamabad, có bằng Tiến sĩ về AI tại Đại học Công nghệ Vienna, Áo. Chuyên về Trí tuệ nhân tạo, Học máy, Khoa học dữ liệu và Thị giác máy tính, ông đã có những đóng góp đáng kể với các công bố trên các tạp chí khoa học uy tín. Tiến sĩ Tehseen cũng đã lãnh đạo nhiều dự án công nghiệp khác nhau với tư cách là Điều tra viên chính và là Nhà tư vấn AI.