AGI

Quyền lực của Rerankers và Truy xuất Hai giai đoạn cho Truy xuất Tăng cường Tạo

Published April 15, 2024

Updated April 27, 2026

Aayush Mittal Mittal

Khi nói đến xử lý ngôn ngữ tự nhiên (NLP) và truy xuất thông tin, khả năng truy xuất thông tin liên quan một cách hiệu quả và chính xác là tối quan trọng. Khi lĩnh vực này tiếp tục phát triển, các kỹ thuật và phương pháp mới đang được phát triển để nâng cao hiệu suất của hệ thống truy xuất, đặc biệt là trong bối cảnh Truy xuất Tăng cường Tạo (RAG). Một trong những kỹ thuật như vậy, được gọi là truy xuất hai giai đoạn với rerankers, đã xuất hiện như một giải pháp mạnh mẽ để giải quyết các hạn chế vốn có của các phương pháp truy xuất truyền thống.

Trong bài viết này, chúng tôi sẽ thảo luận về các细节 của truy xuất hai giai đoạn và rerankers, khám phá các nguyên tắc cơ bản, chiến lược triển khai và lợi ích mà chúng mang lại trong việc nâng cao độ chính xác và hiệu quả của hệ thống RAG. Chúng tôi cũng sẽ cung cấp các ví dụ thực tế và mã code để minh họa các khái niệm và tạo điều kiện cho sự hiểu biết sâu sắc hơn về kỹ thuật tiên tiến này.

Hiểu về Truy xuất Tăng cường Tạo (RAG)

Trước khi đi sâu vào các đặc điểm của truy xuất hai giai đoạn và rerankers, hãy nhắc lại khái niệm về Truy xuất Tăng cường Tạo (RAG). RAG là một kỹ thuật mở rộng kiến thức và khả năng của các mô hình ngôn ngữ lớn (LLM) bằng cách cung cấp cho chúng quyền truy cập vào các nguồn thông tin bên ngoài, chẳng hạn như cơ sở dữ liệu hoặc bộ sưu tập tài liệu. Tham khảo thêm từ bài viết “A Deep Dive into Retrieval Augmented Generation in LLM“.

Quy trình RAG điển hình bao gồm các bước sau:

Truy vấn: Người dùng đặt câu hỏi hoặc cung cấp hướng dẫn cho hệ thống.
Truy xuất: Hệ thống truy vấn cơ sở dữ liệu vector hoặc bộ sưu tập tài liệu để tìm thông tin liên quan đến truy vấn của người dùng.
Tăng cường: Thông tin được truy xuất sẽ được kết hợp với truy vấn ban đầu hoặc hướng dẫn của người dùng.
Tạo: Mô hình ngôn ngữ xử lý đầu vào tăng cường và tạo ra một phản hồi, tận dụng thông tin bên ngoài để nâng cao độ chính xác và toàn diện của đầu ra.

Mặc dù RAG đã chứng minh là một kỹ thuật mạnh mẽ, nhưng nó không thiếu thách thức. Một trong những vấn đề chính nằm ở giai đoạn truy xuất, nơi các phương pháp truy xuất truyền thống có thể không tìm thấy các tài liệu liên quan nhất, dẫn đến phản hồi không tối ưu hoặc không chính xác từ mô hình ngôn ngữ.

Sự cần thiết của Truy xuất Hai giai đoạn và Rerankers

Các phương pháp truy xuất truyền thống, chẳng hạn như dựa trên khớp từ khóa hoặc mô hình không gian vector, thường gặp khó khăn trong việc nắm bắt các mối quan hệ ngữ nghĩa tinh vi giữa truy vấn và tài liệu. Hạn chế này có thể dẫn đến việc truy xuất tài liệu chỉ có liên quan trên bề mặt hoặc bỏ lỡ thông tin quan trọng có thể cải thiện đáng kể chất lượng của phản hồi tạo ra.

Để giải quyết thách thức này, các nhà nghiên cứu và thực hành đã chuyển sang truy xuất hai giai đoạn với rerankers. Phương pháp này bao gồm một quá trình hai bước:

Truy xuất ban đầu: Trong giai đoạn đầu, một tập hợp tài liệu có thể liên quan tương đối lớn được truy xuất bằng cách sử dụng một phương pháp truy xuất nhanh và hiệu quả, chẳng hạn như mô hình không gian vector hoặc tìm kiếm dựa trên từ khóa.
Reranking: Trong giai đoạn thứ hai, một mô hình reranking tinh vi hơn được sử dụng để sắp xếp lại các tài liệu được truy xuất ban đầu dựa trên mức độ liên quan của chúng đến truy vấn, hiệu quả đưa các tài liệu liên quan nhất lên đầu danh sách.

Mô hình reranking, thường là một mạng nơ-ron hoặc kiến trúc dựa trên transformer, được đào tạo cụ thể để đánh giá mức độ liên quan của một tài liệu đến một truy vấn nhất định. Bằng cách tận dụng khả năng hiểu ngôn ngữ tự nhiên tiên tiến, mô hình reranker có thể nắm bắt các mối quan hệ ngữ nghĩa tinh vi và ngữ cảnh giữa truy vấn và tài liệu, dẫn đến một thứ hạng chính xác và liên quan hơn.

Lợi ích của Truy xuất Hai giai đoạn và Rerankers

Sự áp dụng truy xuất hai giai đoạn với rerankers mang lại một số lợi ích đáng kể trong bối cảnh hệ thống RAG:

Độ chính xác được cải thiện: Bằng cách sắp xếp lại các tài liệu được truy xuất ban đầu và đưa các tài liệu liên quan nhất lên đầu, hệ thống có thể cung cấp thông tin chính xác và chính xác hơn cho mô hình ngôn ngữ, dẫn đến phản hồi tạo ra chất lượng cao hơn.
Vấn đề ngoài lĩnh vực được giảm thiểu: Các mô hình nhúng được sử dụng cho truy xuất truyền thống thường được đào tạo trên tập dữ liệu văn bản chung, có thể không nắm bắt được ngôn ngữ và ngữ nghĩa cụ thể của lĩnh vực. Mặt khác, các mô hình reranking có thể được đào tạo trên dữ liệu cụ thể của lĩnh vực, giảm thiểu vấn đề “ngoài lĩnh vực” và cải thiện độ liên quan của tài liệu được truy xuất trong các lĩnh vực chuyên biệt.
Khả năng mở rộng: Phương pháp hai giai đoạn cho phép mở rộng hiệu quả bằng cách tận dụng các phương pháp truy xuất nhanh và nhẹ trong giai đoạn đầu, trong khi dành quá trình reranking đòi hỏi tính toán nhiều hơn cho một tập hợp con nhỏ hơn của tài liệu.
Khả năng linh hoạt: Các mô hình reranking có thể được thay thế hoặc cập nhật độc lập với phương pháp truy xuất ban đầu, cung cấp khả năng linh hoạt và thích ứng với nhu cầu thay đổi của hệ thống.

ColBERT: Tương tác muộn hiệu quả và hiệu quả

Một trong những mô hình nổi bật trong lĩnh vực reranking là ColBERT (Tương tác muộn ngữ cảnh hóa trên BERT). ColBERT là một mô hình reranking tài liệu tận dụng khả năng hiểu ngôn ngữ sâu của BERT trong khi giới thiệu một cơ chế tương tác mới gọi là “tương tác muộn.”

ColBERT: Tìm kiếm đoạn văn hiệu quả và hiệu quả thông qua Tương tác muộn ngữ cảnh hóa trên BERT

Cơ chế tương tác muộn trong ColBERT cho phép truy xuất hiệu quả và chính xác bằng cách xử lý truy vấn và tài liệu riêng biệt cho đến các giai đoạn cuối của quá trình truy xuất. Cụ thể, ColBERT mã hóa độc lập truy vấn và tài liệu bằng BERT, sau đó sử dụng một bước tương tác nhẹ nhưng mạnh mẽ để mô hình hóa sự tương tự tinh vi giữa chúng. Bằng cách trì hoãn nhưng vẫn giữ được sự tương tác tinh vi này, ColBERT có thể tận dụng sự biểu đạt của các mô hình ngôn ngữ sâu trong khi đồng thời có được khả năng tính toán trước các biểu diễn tài liệu ngoại tuyến, làm giảm đáng kể thời gian xử lý truy vấn.

Kiến trúc tương tác muộn của ColBERT mang lại một số lợi ích, bao gồm hiệu quả tính toán được cải thiện, khả năng mở rộng với kích thước của bộ sưu tập tài liệu và khả năng áp dụng thực tế cho các kịch bản thế giới thực. Ngoài ra, ColBERT đã được cải tiến thêm với các kỹ thuật như giám sát bị nhiễu và nén dư (trong ColBERTv2), những kỹ thuật này tinh chỉnh quá trình đào tạo và giảm dấu chân không gian của mô hình trong khi vẫn duy trì hiệu quả truy xuất cao.

Aayush Mittal

Tôi đã dành 5 năm qua để đắm mình trong thế giới hấp dẫn của Máy học và Học sâu. Đam mê và chuyên môn của tôi đã dẫn tôi đến việc đóng góp vào hơn 50 dự án kỹ thuật phần mềm đa dạng, với trọng tâm đặc biệt là AI/ML. Sự tò mò liên tục của tôi cũng đã thu hút tôi đến Xử lý Ngôn ngữ Tự nhiên, một lĩnh vực tôi渴望 khám phá thêm.