Trí tuệ nhân tạo

Chống lại ảo giác LLM bằng Retrieval Augmented Generation (RAG)

Đã xuất bản 5 tháng 3, 2024

Đã cập nhật 15 tháng 5, 2026

Haziqa Sajid

Mô hình ngôn ngữ lớn (LLM) đang cách mạng hóa cách chúng ta xử lý và tạo ra ngôn ngữ, nhưng chúng không hoàn hảo. Giống như con người có thể nhìn thấy hình dạng trong đám mây hoặc khuôn mặt trên mặt trăng, LLM cũng có thể “ảo giác”, tạo ra thông tin không chính xác. Hiện tượng này, được gọi là ảo giác LLM, đang trở thành một mối quan tâm ngày càng tăng khi sử dụng LLM mở rộng.

Lỗi có thể làm cho người dùng bị nhầm lẫn và trong một số trường hợp, thậm chí dẫn đến rắc rối pháp lý cho các công ty. Ví dụ, vào năm 2023, một cựu chiến binh Không quân Jeffery Battle (biết đến với tên The Aerospace Professor) đã đệ đơn kiện chống lại Microsoft khi anh phát hiện ra rằng công cụ tìm kiếm Bing của Microsoft, được hỗ trợ bởi ChatGPT, đôi khi cung cấp thông tin không chính xác và có hại về tên của anh. Công cụ tìm kiếm nhầm lẫn anh với một kẻ bị kết án tên Jeffery Leon Battle.

Để giải quyết vấn đề ảo giác, Retrieval-Augmented Generation (RAG) đã xuất hiện như một giải pháp đầy hứa hẹn. Nó kết hợp kiến thức từ các cơ sở dữ liệu bên ngoài để tăng cường độ chính xác và độ tin cậy của LLM. Hãy cùng xem xét cách RAG làm cho LLM trở nên chính xác và đáng tin cậy hơn. Chúng ta cũng sẽ thảo luận về việc liệu RAG có thể chống lại vấn đề ảo giác LLM một cách hiệu quả hay không.

Hiểu về ảo giác LLM: Nguyên nhân và Ví dụ

LLM, bao gồm cả các mô hình nổi tiếng như ChatGPT, ChatGLM và Claude, được đào tạo trên các tập dữ liệu văn bản rộng lớn nhưng không miễn nhiễm với việc tạo ra đầu ra không chính xác, một hiện tượng gọi là “ảo giác”. Ảo giác xảy ra vì LLM được đào tạo để tạo ra các phản hồi có ý nghĩa dựa trên các quy tắc ngôn ngữ cơ bản, bất kể độ chính xác của chúng.

Một nghiên cứu của Tidio cho thấy rằng trong khi 72% người dùng tin rằng LLM là đáng tin cậy, 75% đã nhận được thông tin không chính xác từ AI ít nhất một lần. Thậm chí những mô hình LLM hứa hẹn nhất như GPT-3.5 và GPT-4 cũng có thể tạo ra nội dung không chính xác hoặc vô nghĩa.

Dưới đây là một cái nhìn tổng quan về các loại ảo giác LLM phổ biến:

Loại ảo giác AI phổ biến:

Sự kết hợp nguồn: Điều này xảy ra khi một mô hình kết hợp chi tiết từ các nguồn khác nhau, dẫn đến mâu thuẫn hoặc thậm chí tạo ra nguồn không chính xác.
Lỗi thực tế: LLM có thể tạo ra nội dung với cơ sở thực tế không chính xác, đặc biệt là khi internet có những thông tin không chính xác
Thông tin vô nghĩa: LLM dự đoán từ tiếp theo dựa trên xác suất. Điều này có thể dẫn đến văn bản chính xác về mặt ngữ pháp nhưng vô nghĩa, khiến người dùng bị lừa về quyền lực của nội dung.

Năm ngoái, hai luật sư phải đối mặt với khả năng bị phạt vì đã引用 sáu trường hợp không tồn tại trong các tài liệu pháp lý của họ, bị lừa bởi thông tin được tạo ra bởi ChatGPT. Ví dụ này nhấn mạnh tầm quan trọng của việc tiếp cận nội dung được tạo ra bởi LLM với một cái nhìn phê phán, nhấn mạnh nhu cầu xác minh để đảm bảo độ tin cậy. Mặc dù khả năng sáng tạo của nó mang lại lợi ích cho các ứng dụng như kể chuyện, nó đặt ra thách thức cho các nhiệm vụ yêu cầu tuân thủ nghiêm ngặt các事 thực, chẳng hạn như tiến hành nghiên cứu học thuật, viết phân tích y tế và tài chính, và cung cấp tư vấn pháp lý.

Khám phá giải pháp cho ảo giác LLM: Cách Retrieval Augmented Generation (RAG) hoạt động

Năm 2020, các nhà nghiên cứu LLM đã giới thiệu một kỹ thuật gọi là Retrieval-Augmented Generation (RAG) để giảm thiểu ảo giác LLM bằng cách tích hợp một nguồn dữ liệu bên ngoài. Không giống như LLM truyền thống chỉ dựa vào kiến thức được đào tạo trước, các mô hình LLM dựa trên RAG tạo ra phản hồi chính xác về mặt thực tế bằng cách động态 tìm kiếm thông tin liên quan từ cơ sở dữ liệu bên ngoài trước khi trả lời câu hỏi hoặc tạo văn bản.

Quá trình RAG:

Các bước của RAG

Các bước của quá trình RAG: Nguồn

Bước 1: Tìm kiếm

Hệ thống tìm kiếm một cơ sở kiến thức cụ thể để tìm thông tin liên quan đến truy vấn của người dùng. Ví dụ, nếu ai đó hỏi về người chiến thắng World Cup bóng đá cuối cùng, nó sẽ tìm kiếm thông tin bóng đá liên quan.

Bước 2: Tăng cường

Truy vấn ban đầu sau đó được tăng cường với thông tin tìm thấy. Sử dụng ví dụ bóng đá, truy vấn “Ai đã giành chiến thắng World Cup bóng đá?” được cập nhật với chi tiết cụ thể như “Argentina đã giành chiến thắng World Cup bóng đá.”

Bước 3: Tạo

Với truy vấn được tăng cường, LLM tạo ra một phản hồi chi tiết và chính xác. Trong trường hợp của chúng tôi, nó sẽ tạo ra một phản hồi dựa trên thông tin tăng cường về Argentina giành chiến thắng World Cup.

Phương pháp này giúp giảm thiểu sự không chính xác và đảm bảo rằng phản hồi của LLM trở nên đáng tin cậy và dựa trên dữ liệu chính xác hơn.

Ưu và nhược điểm của RAG trong việc giảm ảo giác

RAG đã thể hiện sự hứa hẹn trong việc giảm ảo giác bằng cách sửa đổi quá trình tạo. Cơ chế này cho phép các mô hình RAG cung cấp thông tin chính xác, cập nhật và phù hợp với ngữ cảnh hơn.

Đúng vậy, việc thảo luận về Retrieval Augmented Generation (RAG) trong một ý nghĩa chung cho phép hiểu rõ hơn về lợi thế và hạn chế của nó trên các triển khai khác nhau.

Ưu điểm của RAG:

Tìm kiếm thông tin tốt hơn: RAG nhanh chóng tìm thấy thông tin chính xác từ các nguồn dữ liệu lớn.
Nội dung được cải thiện: Nó tạo ra nội dung rõ ràng, phù hợp với nhu cầu của người dùng.
Sử dụng linh hoạt: Người dùng có thể điều chỉnh RAG để phù hợp với yêu cầu cụ thể của họ, chẳng hạn như sử dụng nguồn dữ liệu độc quyền của họ, tăng cường hiệu quả.

Thách thức của RAG:

Cần dữ liệu cụ thể: Hiểu rõ ngữ cảnh của truy vấn để cung cấp thông tin liên quan và chính xác có thể khó khăn.
Khả năng mở rộng: Mở rộng mô hình để xử lý các tập dữ liệu và truy vấn lớn trong khi duy trì hiệu suất là khó khăn.
Cập nhật liên tục: Cập nhật tự động cơ sở dữ liệu kiến thức với thông tin mới nhất là tốn nhiều tài nguyên.

Khám phá các giải pháp thay thế cho RAG

Ngoài RAG, dưới đây là một số phương pháp hứa hẹn khác cho phép các nhà nghiên cứu LLM giảm ảo giác:

G-EVAL: Xác minh độ chính xác của nội dung được tạo với một tập dữ liệu đáng tin cậy, tăng cường độ tin cậy.
SelfCheckGPT: Tự động kiểm tra và sửa lỗi của chính nó để giữ cho đầu ra chính xác và nhất quán.
Kỹ thuật tạo truy vấn: Giúp người dùng thiết kế các truy vấn đầu vào chính xác để hướng dẫn mô hình đến các phản hồi chính xác và liên quan.
Tinh chỉnh: Điều chỉnh mô hình cho các tập dữ liệu cụ thể cho từng nhiệm vụ để cải thiện hiệu suất trong lĩnh vực cụ thể.
LoRA (Low-Rank Adaptation): Phương pháp này sửa đổi một phần nhỏ của các tham số mô hình cho việc thích nghi với từng nhiệm vụ, tăng cường hiệu quả.

Việc khám phá RAG và các giải pháp thay thế của nó nhấn mạnh cách tiếp cận động và đa diện để cải thiện độ chính xác và độ tin cậy của LLM. Khi chúng ta tiến bộ, sự đổi mới liên tục trong các công nghệ như RAG là thiết yếu để giải quyết các thách thức vốn có của ảo giác LLM.

Để cập nhật các phát triển mới nhất trong lĩnh vực trí tuệ nhân tạo và học máy, bao gồm cả phân tích chuyên sâu và tin tức, hãy truy cập unite.ai.