人工智能

重定义搜索:新兴对话式搜索引擎如何克服过时的LLM和传统搜索引擎的局限性

mm

对话式搜索引擎的出现正在改变我们在线检索信息的方式,从传统的关键词搜索转向更自然、更对话式的交互。通过结合大型语言模型(LLM)和实时网络数据,这些新系统解决了传统LLM和标准搜索引擎中的关键问题。在本文中,我们将研究LLM和关键词搜索面临的挑战,并探讨对话式搜索引擎如何提供一个有前途的解决方案。

LLM的过时知识和可靠性挑战

大型语言模型(LLM)已经显著提高了我们访问和解释信息的方法,但它们面临一个主要限制:无法提供实时更新。这些模型是在包含书籍、文章和网站文本的广泛数据集上进行训练的。然而,这些训练数据仅反映了数据收集时的知识,这意味着LLM无法自动更新新信息。为了解决这个问题,LLM必须进行重新训练,这是一个资源密集和昂贵的过程。这个过程包括收集和整理新数据集、重新训练模型和验证其性能。每次迭代都需要大量的计算能力、能量和财务投资,这引发了人们对环境影响的担忧,因为它会产生大量的碳排放。

LLM的静态性质通常导致其响应不准确。当面对最近事件或发展的查询时,这些模型可能会生成基于过时或不完整信息的响应。这可能会导致”幻觉“,即模型产生错误或虚构的事实,从而破坏所提供信息的可靠性。此外,尽管它们拥有大量的训练数据,但LLM在理解当前事件或新兴趋势的全部背景方面仍然存在困难,这限制了它们的相关性和有效性。

LLM的另一个重大缺点是缺乏引用或来源透明度。与传统搜索引擎不同,传统搜索引擎提供原始来源的链接,LLM根据汇总信息生成响应,而不指定信息来源。这种来源的缺乏不仅使用户难以验证所提供信息的准确性,还限制了内容的可追溯性,使用户更难判断所提供答案的可靠性。因此,用户可能会发现验证信息或探索内容原始来源变得具有挑战性。

传统网络搜索引擎的背景和信息过载挑战

尽管传统网络搜索引擎仍然是访问广泛信息的重要工具,但它们面临着影响结果质量和相关性的几个挑战。传统网络搜索的一个主要挑战是其难以理解背景。搜索引擎严重依赖关键词匹配,这通常会导致结果不具有背景相关性。这意味着用户会收到大量不直接解决他们特定查询的信息,使得筛选和找到最相关的答案变得具有挑战性。虽然搜索引擎使用算法对结果进行排名,但它们通常无法提供基于个体独特需求或偏好的个性化答案。这缺乏个性化可能会导致结果过于通用,不符合用户的特定背景或意图。此外,搜索引擎容易受到SEO垃圾邮件和链接农场的操纵。这些行为可以歪曲结果,促进不太相关或质量较低的内容到搜索结果的顶部。因此,用户可能会接触到误导性或偏见的信息。

对话式搜索引擎的出现

对话式搜索引擎代表了在线交互和检索信息方式的范式转变。与依赖关键词匹配和算法排名来提供结果的传统搜索引擎不同,对话式搜索引擎利用先进的语言模型来理解和以自然、类似人类的方式响应用户查询。这种方法旨在通过让用户参与对话而不是呈现链接列表来提供一种更直观和高效的信息检索方式。

对话式搜索引擎利用大型语言模型(LLM)的力量来处理和解释查询的背景,从而实现更准确和相关的响应。这些引擎旨在与用户动态交互,提出后续问题来细化搜索,并在需要时提供额外信息。这种方式不仅增强了用户体验,还显著提高了检索信息的质量。

对话式搜索引擎的一个主要优势是能够提供实时更新和背景理解。通过将信息检索能力与生成模型相结合,这些引擎可以检索和整合网络上的最新数据,确保响应是当前的和准确的。这解决了传统LLM的一个主要限制,即通常依赖于过时的训练数据。

此外,对话式搜索引擎提供了一种传统搜索引擎所缺乏的透明度。它们直接将用户与可靠的来源连接起来,提供清晰的引用和相关内容的链接。这促进了信任,并使用户能够验证所接收的信息,促进了更明智和批判性的信息消费方式。

对话式搜索引擎与检索增强生成(RAG)

如今,人们常用的AI启用信息检索系统之一被称为RAG。虽然对话式搜索引擎与RAG共享相似之处,但它们在目标方面存在关键差异。两种系统都将信息检索与生成语言模型相结合,以提供准确和背景相关的答案。它们从外部来源提取实时数据并将其集成到生成过程中,确保生成的响应是当前的和全面的。

然而,RAG系统(如Bing)专注于将检索的数据与生成输出合并,以提供精确的信息。它们不具备让用户系统地细化搜索的后续能力。相比之下,对话式搜索引擎(如OpenAI的SearchGPT)与用户进行对话。它们利用先进的语言模型以自然的方式理解和响应查询,提出后续问题并在需要时提供额外信息来细化搜索。

实际例子

以下是两个对话式搜索引擎的实际例子:

  • Perplexity: Perplexity 是一个对话式搜索引擎,允许用户以自然和背景相关的方式与在线信息交互。它提供了“焦点”选项来将搜索范围缩小到特定平台,以及“相关”功能来建议后续问题。Perplexity采用免费增值模式,基本版本提供独立的LLM功能,而付费的Perplexity Pro提供了更高级的模型,如GPT-4和Claude 3.5,以及增强的查询细化和文件上传功能。
  • SearchGPT: OpenAI最近推出了SearchGPT,一种将对话能力与实时网络更新相结合的工具。这有助于用户以更直观和直接的方式访问相关信息。与传统搜索引擎不同,传统搜索引擎可能会让人感到不知所措和不够个性化,SearchGPT提供了简洁的答案,并以对话式的方式与用户交互。它可以提出后续问题并在需要时提供额外信息,使搜索体验更加互动和用户友好。SearchGPT的一个关键功能是其透明度。它直接将用户与可靠的来源连接起来,提供清晰的引用和相关内容的链接。这使用户能够验证信息并更深入地探索主题。

结论

对话式搜索引擎正在改变我们在线检索信息的方式。通过结合实时网络数据和先进的语言模型,这些新系统解决了传统LLM和关键词搜索的许多局限性。它们提供了更为当前和准确的信息,并通过直接链接到可靠的来源提高了透明度。随着SearchGPT和Perplexity.ai等对话式搜索引擎的发展,它们为搜索提供了更为直观和可靠的方法,超越了传统方法的局限性。

Dr. Tehseen Zia 是 COMSATS University Islamabad 的终身副教授,拥有来自奥地利维也纳科技大学的人工智能博士学位。专攻人工智能、机器学习、数据科学和计算机视觉,他在著名的科学期刊上发表了重要贡献。 Dr. Tehseen 还作为首席调查员领导了各种工业项目,并担任人工智能顾问。