Lãnh đạo tư tưởng

Liệu RAG có phải là giải pháp cho ảo giác AI?

mm

Trí tuệ nhân tạo, theo thiết kế, có một “tư duy riêng”. Một điểm yếu của điều này là các mô hình Trí tuệ nhân tạo tạo ra sẽ偶爾 tạo ra thông tin không chính xác trong một hiện tượng gọi là “ảo giác AI”, một trong những ví dụ đầu tiên của hiện tượng này là khi một thẩm phán New York phán quyết các luật sư sử dụng một bản cáo trạng viết bởi ChatGPT có tham chiếu đến các vụ án tòa án không tồn tại. Gần đây, đã có các vụ việc các công cụ tìm kiếm tạo ra bởi AI hướng dẫn người dùng tiêu thụ đá để có lợi cho sức khỏe, hoặc sử dụng keo không độc hại keo để giúp phô mai dính vào bánh pizza.

Khi GenAI trở nên phổ biến hơn, điều quan trọng là những người áp dụng phải nhận ra rằng ảo giác là, hiện tại, một khía cạnh không thể tránh khỏi của các giải pháp GenAI. Được xây dựng trên các mô hình ngôn ngữ lớn (LLM), các giải pháp này thường được thông tin bởi một lượng lớn các nguồn thông tin khác nhau có thể chứa ít nhất một số thông tin không chính xác hoặc lỗi thời – những câu trả lời bịa đặt này chiếm giữa 3% và 10% câu trả lời được tạo ra bởi các rô-bốt trò chuyện AI cho các yêu cầu của người dùng. Trong ánh sáng của tính chất ” hộp đen” của AI – trong đó, như con người, chúng ta có khó khăn đặc biệt trong việc kiểm tra chính xác cách AI tạo ra kết quả của nó, – những ảo giác này có thể gần như không thể cho các nhà phát triển để theo dõi và hiểu.

Dù không thể tránh khỏi, ảo giác AI gây thất vọng ở mức tốt nhất, nguy hiểm và không đạo đức ở mức tồi tệ nhất.

Trên nhiều lĩnh vực, bao gồm chăm sóc sức khỏe, tài chính và an toàn công cộng, những hệ lụy của ảo giác bao gồm mọi thứ từ việc lan truyền thông tin sai lệch và làm suy yếu dữ liệu nhạy cảm đến thậm chí là tai nạn nguy hiểm đến tính mạng. Nếu ảo giác tiếp tục không được kiểm soát, sự an toàn của người dùng và niềm tin xã hội vào các hệ thống AI sẽ bị suy yếu.

Như vậy, điều quan trọng là những người quản lý công nghệ mạnh mẽ này phải nhận ra và giải quyết các rủi ro của ảo giác AI để đảm bảo tính hợp pháp của các đầu ra được tạo ra bởi LLM.

RAG như một điểm khởi đầu để giải quyết ảo giác

Một phương pháp đã nổi lên để giảm thiểu ảo giác là tạo ra tăng cường, hoặc RAG. Giải pháp này tăng cường độ tin cậy của LLM thông qua việc tích hợp các nguồn thông tin bên ngoài – trích xuất thông tin liên quan từ một cơ sở dữ liệu đáng tin cậy được chọn theo tính chất của yêu cầu – để đảm bảo các câu trả lời đáng tin cậy hơn cho các yêu cầu cụ thể.

Một số chuyên gia ngành công nghiệp đã đề xuất rằng RAG alone có thể giải quyết ảo giác. Nhưng các cơ sở dữ liệu tích hợp RAG vẫn có thể bao gồm dữ liệu lỗi thời, có thể tạo ra thông tin sai hoặc gây hiểu lầm. Trong một số trường hợp, việc tích hợp dữ liệu bên ngoài thông qua RAG có thể thậm chí tăng khả năng ảo giác trong các mô hình ngôn ngữ lớn: Nếu một mô hình AI phụ thuộc quá nhiều vào một cơ sở dữ liệu lỗi thời mà nó nhận thức là được cập nhật đầy đủ, mức độ của ảo giác có thể trở nên nghiêm trọng hơn.

AI Guardrails – Cầu nối RAG

Như bạn có thể thấy, RAG giữ nhiều hứa hẹn để giảm thiểu ảo giác AI. Tuy nhiên, các ngành công nghiệp và doanh nghiệp chuyển sang các giải pháp này cũng phải hiểu rõ các hạn chế vốn có của chúng. Thật vậy, khi được sử dụng cùng với RAG, có các phương pháp bổ sung nên được sử dụng khi giải quyết ảo giác LLM.

Ví dụ, các doanh nghiệp có thể sử dụng các rào chắn AI thực thời để bảo vệ các phản hồi LLM và giảm thiểu ảo giác AI. Rào chắn hoạt động như một mạng lưới kiểm tra tất cả các đầu ra LLM cho nội dung bịa đặt, khiêu dâm hoặc không liên quan trước khi nó đến tay người dùng. Cách tiếp cận middleware chủ động này đảm bảo tính tin cậy và liên quan của việc thu thập trong các hệ thống RAG, cuối cùng tăng cường niềm tin của người dùng và đảm bảo các tương tác an toàn phù hợp với thương hiệu của công ty.

Thay vào đó, có phương pháp “kỹ thuật lời nhắc” yêu cầu kỹ sư thay đổi lời nhắc chính. Bằng cách thêm các ràng buộc đã xác định trước vào các lời nhắc có thể chấp nhận được – nghĩa là, theo dõi không chỉ nơi LLM nhận thông tin mà còn cách người dùng yêu cầu nó trả lời – các lời nhắc được thiết kế có thể hướng dẫn LLM đến các kết quả đáng tin cậy hơn. Nhược điểm chính của phương pháp này là việc thiết kế lời nhắc này có thể là một nhiệm vụ tốn thời gian đáng kể cho các lập trình viên, những người thường đã bị kéo căng về thời gian và tài nguyên.

Phương pháp “tinh chỉnh” liên quan đến việc đào tạo LLM trên các tập dữ liệu chuyên dụng để tinh chỉnh hiệu suất và giảm thiểu rủi ro của ảo giác. Phương pháp này đào tạo LLM chuyên nhiệm vụ để kéo từ các lĩnh vực đáng tin cậy cụ thể, cải thiện độ chính xác và độ tin cậy trong đầu ra.

Cũng quan trọng là phải xem xét tác động của độ dài đầu vào đối với hiệu suất suy luận của LLM – thực tế, nhiều người dùng có xu hướng nghĩ rằng đầu vào càng dài và có nhiều tham số, đầu ra sẽ càng chính xác. Tuy nhiên, một nghiên cứu gần đây cho thấy rằng độ chính xác của đầu ra LLM thực sự giảm khi độ dài đầu vào tăng. Do đó, việc tăng số lượng hướng dẫn được chỉ định cho bất kỳ lời nhắc nào không đảm bảo tính nhất quán trong việc tạo ra các ứng dụng AI tạo ra đáng tin cậy.

Hiện tượng này, được gọi là quá tải lời nhắc, nhấn mạnh các rủi ro vốn có của thiết kế lời nhắc quá phức tạp – càng rộng lời nhắc được diễn đạt, càng nhiều cánh cửa được mở ra để thông tin không chính xác và ảo giác khi LLM cố gắng thực hiện mọi tham số.

Kỹ thuật lời nhắc đòi hỏi phải cập nhật và tinh chỉnh liên tục và vẫn gặp khó khăn trong việc ngăn chặn ảo giác hoặc phản hồi không hợp lý một cách hiệu quả. Rào chắn, mặt khác, sẽ không tạo ra rủi ro bổ sung của đầu ra bịa đặt, khiến chúng trở thành một lựa chọn hấp dẫn để bảo vệ AI. Không giống như kỹ thuật lời nhắc, rào chắn cung cấp một giải pháp thực thời toàn diện đảm bảo AI tạo ra sẽ chỉ tạo ra đầu ra từ trong các ranh giới được xác định trước.

Khi không phải là một giải pháp độc lập, phản hồi của người dùng cũng có thể giúp giảm thiểu ảo giác với các hành động như upvote và downvote giúp tinh chỉnh mô hình, cải thiện độ chính xác của đầu ra và giảm rủi ro của ảo giác.

Khi riêng lẻ, các giải pháp RAG đòi hỏi phải thử nghiệm rộng rãi để đạt được kết quả chính xác. Nhưng khi được kết hợp với tinh chỉnh, kỹ thuật lời nhắc và rào chắn, chúng có thể cung cấp các giải pháp nhắm mục tiêu và hiệu quả hơn để giải quyết ảo giác. Việc khám phá các chiến lược bổ sung này sẽ tiếp tục cải thiện việc giảm thiểu ảo giác trong LLM, giúp phát triển các mô hình đáng tin cậy và đáng tin cậy hơn trên nhiều ứng dụng.

RAG không phải là giải pháp cho ảo giác AI

Giải pháp RAG thêm giá trị to lớn cho LLM bằng cách làm giàu chúng với kiến thức bên ngoài. Nhưng với nhiều điều vẫn chưa được biết về trí tuệ nhân tạo tạo ra, ảo giác vẫn là một thách thức vốn có. Chìa khóa để chống lại chúng không nằm ở việc cố gắng loại bỏ chúng, mà là giảm thiểu ảnh hưởng của chúng bằng cách kết hợp các rào chắn chiến lược, quá trình kiểm tra và lời nhắc tinh chỉnh.

Càng tin tưởng những gì GenAI nói với chúng ta, chúng ta sẽ càng có thể tận dụng hiệu quả và hiệu suất tiềm năng mạnh mẽ của nó.

Liran Hason là Đồng sáng lập và CEO của Aporia, nền tảng Kiểm soát Trí tuệ Nhân tạo hàng đầu, được các công ty Fortune 500 và các nhà lãnh đạo ngành công nghiệp trên toàn thế giới tin cậy để đảm bảo niềm tin vào GenAI. Aporia cũng được công nhận là Nhà tiên phong Công nghệ bởi Diễn đàn Kinh tế Thế giới. Trước khi thành lập Aporia, Liran từng là Kiến trúc sư Học máy tại Adallom (được Microsoft mua lại) và sau đó là nhà đầu tư tại Vertex Ventures. Liran thành lập Aporia sau khi chứng kiến trực tiếp tác động của Trí tuệ Nhân tạo mà không có rào cản. Năm 2022, Forbes đã đặt tên Aporia là "Công ty Tiếp theo có Giá trị Một tỷ Đô la"