Connect with us

Định nghĩa lại Tìm kiếm: Làm thế nào các Công cụ Đối thoại Tiềm năng Vượt qua LLM Cũ và Công cụ Tìm kiếm Truyền thống Không có Context

Trí tuệ nhân tạo

Định nghĩa lại Tìm kiếm: Làm thế nào các Công cụ Đối thoại Tiềm năng Vượt qua LLM Cũ và Công cụ Tìm kiếm Truyền thống Không có Context

mm

Sự ra đời của công cụ tìm kiếm đối thoại đang định nghĩa lại cách chúng ta thu thập thông tin trực tuyến, chuyển từ tìm kiếm từ khóa truyền thống sang các tương tác đối thoại tự nhiên hơn. Bằng cách kết hợp mô hình ngôn ngữ lớn (LLM) với dữ liệu web thời gian thực, những hệ thống mới này giải quyết các vấn đề chính được tìm thấy trong cả LLM cũ và công cụ tìm kiếm tiêu chuẩn. Trong bài viết này, chúng tôi sẽ xem xét các thách thức mà LLM và tìm kiếm dựa trên từ khóa phải đối mặt và khám phá cách công cụ tìm kiếm đối thoại cung cấp một giải pháp hứa hẹn.

Thách thức về Kiến thức Cũ và Tính Tin cậy trong LLM

Mô hình ngôn ngữ lớn (LLM) đã thúc đẩy đáng kể phương pháp của chúng tôi để truy cập và giải thích thông tin, nhưng chúng phải đối mặt với một hạn chế lớn: khả năng không cung cấp cập nhật thời gian thực. Những mô hình này được đào tạo trên các tập dữ liệu rộng lớn bao gồm văn bản từ sách, bài viết và trang web. Tuy nhiên, dữ liệu đào tạo này phản ánh kiến thức chỉ đến thời điểm nó được thu thập, có nghĩa là LLM không thể tự động cập nhật với thông tin mới. Để giải quyết vấn đề này, LLM phải trải qua quá trình đào tạo lại, một quá trình đòi hỏi nhiều tài nguyên và tốn kém. Điều này liên quan đến việc thu thập và biên soạn các tập dữ liệu mới, đào tạo lại mô hình và xác thực hiệu suất của nó. Mỗi lần lặp lại đòi hỏi phải có sức mạnh tính toán đáng kể, năng lượng và đầu tư tài chính, làm dấy lên lo ngại về tác động môi trường do lượng khí thải carbon đáng kể.

Bản chất tĩnh của LLM thường dẫn đến sự không chính xác trong phản hồi của chúng. Khi đối mặt với các truy vấn về sự kiện gần đây hoặc phát triển, những mô hình này có thể tạo ra phản hồi dựa trên thông tin cũ hoặc không đầy đủ. Điều này có thể dẫn đến “ảo giác“, nơi mô hình tạo ra sự kiện không chính xác hoặc bịa đặt, làm suy yếu tính tin cậy của thông tin được cung cấp. Hơn nữa, mặc dù có dữ liệu đào tạo rộng lớn, LLM gặp khó khăn trong việc hiểu đầy đủ bối cảnh của các sự kiện hiện tại hoặc xu hướng mới nổi, hạn chế tính liên quan và hiệu quả của chúng.

Một điểm yếu đáng kể khác của LLM là thiếu minh bạch về trích dẫn hoặc nguồn gốc. Không giống như công cụ tìm kiếm truyền thống, cung cấp liên kết đến nguồn gốc, LLM tạo ra phản hồi dựa trên thông tin tổng hợp mà không chỉ ra nơi nó xuất phát. Sự thiếu minh bạch về nguồn gốc này không chỉ cản trở khả năng của người dùng trong việc xác minh độ chính xác của thông tin mà còn hạn chế khả năng theo dõi của nội dung, khiến người dùng khó xác định tính tin cậy của câu trả lời được cung cấp. Do đó, người dùng có thể gặp khó khăn trong việc xác thực thông tin hoặc khám phá nguồn gốc của nội dung.

Thách thức về Bối cảnh và Thông tin Quá tải trong Công cụ Tìm kiếm Truyền thống

Mặc dù công cụ tìm kiếm web truyền thống vẫn còn quan trọng để truy cập vào một loạt thông tin, chúng phải đối mặt với một số thách thức ảnh hưởng đến chất lượng và tính liên quan của kết quả. Một thách thức lớn với tìm kiếm web này là khó khăn trong việc hiểu bối cảnh. Công cụ tìm kiếm phụ thuộc nặng vào việc khớp từ khóa, thường dẫn đến kết quả không liên quan về mặt bối cảnh. Điều này có nghĩa người dùng nhận được một lượng thông tin không trực tiếp giải quyết truy vấn cụ thể của họ, khiến việc tìm kiếm và tìm ra câu trả lời phù hợp trở nên khó khăn. Mặc dù công cụ tìm kiếm sử dụng thuật toán để xếp hạng kết quả, chúng thường không cung cấp câu trả lời được cá nhân hóa dựa trên nhu cầu hoặc sở thích duy nhất của từng cá nhân. Sự thiếu cá nhân hóa này có thể dẫn đến kết quả chung chung không phù hợp với bối cảnh hoặc ý định cụ thể của người dùng. Hơn nữa, công cụ tìm kiếm dễ bị thao túng thông qua việc spam SEO và trang trại liên kết. Những hành vi này có thể làm sai lệch kết quả, thúc đẩy nội dung không liên quan hoặc chất lượng thấp hơn lên đầu bảng xếp hạng tìm kiếm. Người dùng có thể gặp phải thông tin sai lệch hoặc thiên vị do đó.

Sự Xuất hiện của Công cụ Tìm kiếm Đối thoại

Một công cụ tìm kiếm đối thoại đại diện cho một bước ngoặt trong cách chúng ta tương tác và thu thập thông tin trực tuyến. Không giống như công cụ tìm kiếm truyền thống dựa vào việc khớp từ khóa và xếp hạng thuật toán để cung cấp kết quả, công cụ tìm kiếm đối thoại tận dụng mô hình ngôn ngữ tiên tiến để hiểu và phản hồi truy vấn của người dùng theo cách tự nhiên, giống con người. Cách tiếp cận này nhằm cung cấp một cách tìm kiếm thông tin trực quan và hiệu quả hơn bằng cách tham gia người dùng vào một cuộc trò chuyện thay vì trình bày một danh sách liên kết.

Công cụ tìm kiếm đối thoại sử dụng sức mạnh của mô hình ngôn ngữ lớn (LLM) để xử lý và giải thích bối cảnh của truy vấn, cho phép phản hồi chính xác và liên quan hơn. Những công cụ này được thiết kế để tương tác động với người dùng, đặt câu hỏi theo dõi để tinh chỉnh tìm kiếm và cung cấp thông tin bổ sung khi cần. Điều này không chỉ nâng cao trải nghiệm người dùng mà còn cải thiện đáng kể chất lượng thông tin thu được.

Một trong những lợi thế chính của công cụ tìm kiếm đối thoại là khả năng cung cấp cập nhật thời gian thực và hiểu biết về bối cảnh. Bằng cách tích hợp khả năng thu thập thông tin với mô hình ngôn ngữ tạo, những công cụ này có thể thu thập và tích hợp dữ liệu mới nhất từ web, đảm bảo rằng phản hồi luôn cập nhật và chính xác. Điều này giải quyết một trong những hạn chế chính của LLM truyền thống, thường dựa vào dữ liệu đào tạo cũ.

Hơn nữa, công cụ tìm kiếm đối thoại cung cấp mức độ minh bạch mà công cụ tìm kiếm truyền thống không có. Chúng kết nối người dùng trực tiếp với nguồn đáng tin cậy, cung cấp trích dẫn và liên kết rõ ràng đến nội dung liên quan. Sự minh bạch này tạo dựng niềm tin và cho phép người dùng xác minh thông tin họ nhận được, thúc đẩy một cách tiếp cận thông tin có thông tin và批判 hơn.

Công cụ Tìm kiếm Đối thoại so với Tạo ra Tăng cường Thu thập (RAG)

Hiện nay, một trong những hệ thống thu thập thông tin được hỗ trợ bởi AI phổ biến là RAG. Mặc dù công cụ tìm kiếm đối thoại chia sẻ sự tương đồng với RAG, chúng có sự khác biệt chính, đặc biệt là trong mục tiêu. Cả hai hệ thống kết hợp thu thập thông tin với mô hình ngôn ngữ tạo để cung cấp câu trả lời chính xác và liên quan về mặt bối cảnh. Chúng trích xuất dữ liệu thời gian thực từ nguồn ngoài và tích hợp vào quá trình tạo, đảm bảo rằng phản hồi tạo ra luôn cập nhật và toàn diện.

Tuy nhiên, hệ thống RAG, như Bing, tập trung vào việc kết hợp dữ liệu thu thập được với đầu ra tạo để cung cấp thông tin chính xác. Chúng không có khả năng theo dõi cho phép người dùng tinh chỉnh tìm kiếm một cách hệ thống. Ngược lại, công cụ tìm kiếm đối thoại, như SearchGPT của OpenAI, tham gia người dùng vào một cuộc trò chuyện. Chúng tận dụng mô hình ngôn ngữ tiên tiến để hiểu và phản hồi truy vấn một cách tự nhiên, cung cấp câu hỏi theo dõi và thông tin bổ sung để tinh chỉnh tìm kiếm.

Ví dụ trong Thế giới Thực

Dưới đây là hai ví dụ về công cụ tìm kiếm đối thoại:

  • Perplexity: Perplexity là một công cụ tìm kiếm đối thoại cho phép người dùng tương tác tự nhiên và theo bối cảnh với thông tin trực tuyến. Nó cung cấp các tính năng như tùy chọn “Focus” để thu hẹp tìm kiếm vào các nền tảng cụ thể và tính năng “Related” để đề xuất câu hỏi theo dõi. Perplexity hoạt động trên mô hình freemium, với phiên bản cơ bản cung cấp khả năng LLM độc lập và phiên bản Perplexity Pro cung cấp mô hình tiên tiến như GPT-4 và Claude 3.5, cùng với tinh chỉnh truy vấn và tải tệp nâng cao.
  • SearchGPT: OpenAI gần đây đã giới thiệu SearchGPT, một công cụ kết hợp khả năng đối thoại của mô hình ngôn ngữ lớn (LLM) với cập nhật web thời gian thực. Điều này giúp người dùng truy cập thông tin liên quan một cách trực quan và trực tiếp hơn. Không giống như công cụ tìm kiếm truyền thống, có thể gây choáng ngợp và không thân thiện, SearchGPT cung cấp câu trả lời cô đọng và tham gia người dùng vào cuộc trò chuyện. Nó có thể đặt câu hỏi theo dõi và cung cấp thông tin bổ sung khi cần, làm cho trải nghiệm tìm kiếm trở nên tương tác và thân thiện với người dùng hơn. Một tính năng quan trọng của SearchGPT là sự minh bạch của nó. Nó kết nối người dùng trực tiếp với nguồn đáng tin cậy, cung cấp trích dẫn và liên kết rõ ràng đến nội dung liên quan. Điều này cho phép người dùng xác minh thông tin và khám phá chủ đề một cách toàn diện hơn.

Kết luận

Công cụ tìm kiếm đối thoại đang thay đổi cách chúng ta tìm kiếm thông tin trực tuyến. Bằng cách kết hợp dữ liệu web thời gian thực với mô hình ngôn ngữ tiên tiến, những hệ thống mới này giải quyết nhiều hạn chế của LLM cũ và tìm kiếm dựa trên từ khóa truyền thống. Chúng cung cấp thông tin cập nhật và chính xác hơn và cải thiện minh bạch bằng cách liên kết trực tiếp đến nguồn đáng tin cậy. Khi công cụ tìm kiếm đối thoại như SearchGPT và Perplexity.ai phát triển, chúng cung cấp một cách tiếp cận tìm kiếm trực quan và đáng tin cậy hơn, vượt qua các hạn chế của phương pháp cũ.

Tiến sĩ Tehseen Zia là Giáo sư Liên kết có thời hạn tại Đại học COMSATS Islamabad, nắm giữ bằng Tiến sĩ về Trí tuệ Nhân tạo từ Đại học Công nghệ Vienna, Áo. Chuyên về Trí tuệ Nhân tạo, Học máy, Khoa học Dữ liệu và Thị giác Máy tính, ông đã có những đóng góp đáng kể với các ấn phẩm trên các tạp chí khoa học uy tín. Tiến sĩ Tehseen cũng đã dẫn dắt các dự án công nghiệp khác nhau với tư cách là Điều tra viên Chính và từng là Tư vấn viên Trí tuệ Nhân tạo.