AI 模型与平台

上下文工程与提示工程:人工智能交互指南

mm

人工智能革命始于一个简单的认识:提问的方式很重要。工程师和用户都发现,精心设计的提示可以解锁语言模型的卓越能力,将普通的回复转化为富有洞察力和有用的答案。这种做法,被称为提示工程,在2023年和2024年初主导了人工智能优化的讨论。

但现在发生了一件有趣的事情。随着人工智能系统的成熟和承担更复杂的任务,我们发现,即使是最完美的提示也存在局限性。于是,出现了上下文工程——一种对人工智能交互的根本性转变。

理解提示工程

为了理解我们要去哪里,我们需要欣赏我们从哪里来。提示工程源自一个简单的观察:人工智能模型根据请求的表述方式做出不同的响应

考虑以下两种方法:

  • 基本提示“写关于狗的文章”
  • 工程化提示“假设您是一位具有20年经验的兽医,撰写一份关于照顾老年狗的综合指南,包括健康考虑、饮食需求和运动建议,使用适合宠物主人的温暖、通俗的语气。”

第二种方法通常会产生更好的结果,因为它提供了清晰的上下文、具体的要求和明确的参数。这一发现引发了一种“黄金热潮”。突然,”提示工程师”涌现,提示市场蓬勃发展,每个人都在寻找完美的公式,使人工智能做他们想要的任何事情。

上下文工程的出现

随着组织开始部署人工智能进行严肃的应用,仅仅依靠提示的方法开始出现裂缝。团队会精心设计提示,但他们的人工智能助手仍然难以完成看似简单的任务。问题不在于问题的质量,而在于人工智能缺乏任何人在同样情况下都会拥有的更广泛的上下文。

想象一下,你让一名新员工处理客户投诉。你可以给他们世界上最好的脚本,但如果他们没有访问客户历史、公司政策、产品信息和之前交互的权限,他们仍然会难以提供有意义的帮助。这正是上下文工程要解决的局限性。

上下文工程代表了从优化我们对人工智能说的话到优化人工智能知道什么的转变。它是构建动态系统的学科,这些系统会自动为人工智能模型提供完成任务所需的所有相关信息。

由Philipp Schmid(Google DeepMind)创建的图形

两种方法的故事

这种区别通过例子变得更加明显。假设你正在为一家医疗诊所构建一个人工智能助手。

提示工程方法:你花了数周时间完善像“您是医疗预约助手。当患者请求预约时,始终检查可用性,确认保险,并提供准备说明…”这样的提示。

这在现实世界的复杂性来临之前效果相当好。一个患者打电话说:“我需要见约翰逊博士关于我的持续性问题。”人工智能缺乏更广泛的上下文,必须开始一个繁琐的来回对话:“什么持续性问题?你最后一次访问是什么时候?我们有三位约翰逊博士——哪一位?”

上下文工程方法:当同一位患者提到他们的“持续性问题”时,系统已经可以访问:

  • 他们的病史
  • 之前的预约
  • 保险信息
  • 他们之前见过的具体约翰逊博士

它可以立即做出响应:“我看到你已经在心脏病学方面与约翰逊博士进行了高血压随访。她星期二下午2点或星期四上午10点有空。哪个时间更适合你?”

魔力不在于更聪明的提示——而在于系统能够动态地收集和呈现来自多个来源的相关信息,恰好在需要的时候。

理解上下文的层次

使上下文工程具有挑战性的原因是上下文并不是单一的。它由多个层次组成,每个层次都有不同的目的:

  • 立即上下文当前对话和用户请求——现在发生了什么。
  • 历史上下文过去的交互、偏好和模式,这些信息可以为当前需求提供参考。这包括从以前的支持票到已建立的用户偏好等一切内容。
  • 环境上下文外部因素,如时间、用户位置或当前事件,这些因素可能会影响交互。
  • 领域上下文特定任务或行业相关的专业知识、规则和程序。

管理这些层次需要复杂的编排。系统必须决定什么信息是相关的,如何优先考虑冲突的数据,何时更新存储的信息,以及如何以增强而不是压倒人工智能模型决策的方式呈现所有信息。

由Alex McFarland/Unite AI创建的图形

为什么上下文工程现在很重要

几个因素的汇聚使得上下文工程不仅有用,而且至关重要:

首先,人工智能应用变得更加复杂。我们不再满足于可以回答简单问题的聊天机器人。今天的人工智能代理处理多步骤工作流,根据复杂标准做出决定,并与多个系统交互。这些复杂的应用程序根本无法仅靠提示有效地运行。

其次,用户期望大幅提高。人们现在希望人工智能能够像知识渊博的助手一样理解上下文。他们希望人工智能能够记住以前的对话,理解他们的偏好,并能够在不被明确告知的情况下访问相关信息。

第三,失败的成本增加了。当人工智能主要用于创意写作或随意对话时,错误的后果很小。现在,人工智能处理客户服务、医疗预约、财务分析和其他关键任务,做错事会有真正的后果。

上下文工程的核心原则

通过试验和错误,人工智能社区已经确定了指导有效上下文工程的几项基本原则:

1. 动态信息组装

上下文必须根据当前需求进行调整。客户询问运输信息需要的上下文与询问退货信息的客户不同,即使是同一个人。好的上下文工程系统可以识别这些变化并相应地进行调整。

2. 智能过滤和优先级排序

并非所有信息都有帮助。事实上,过多的上下文可能与过少的上下文一样有问题。有效的系统必须:

  • 选择相关信息
  • 以有用的层次结构组织信息
  • 删除过时或冲突的数据
  • 以人工智能模型可以高效处理的格式呈现信息

3. 持续学习和适应

上下文系统应该随着时间的推移而改进。它们需要从成功的交互中学习,识别信息缺口,并适应不断变化的模式。这有助于完善提供什么信息以及何时提供信息。

4. 无缝集成

最好的上下文工程是不可见的。用户不应该思考它或管理它。他们应该只是体验到人工智能似乎非常了解并且有帮助的感觉。

常见的陷阱和如何避免它们

随着团队实施上下文工程,几个挑战经常出现:

  • 上下文过载热情的团队经常错误地提供过多的上下文,从而导致响应速度变慢和人工智能行为混乱。解决方案是无情的优先排序——只包括直接服务于当前任务的内容。
  • 过时信息如果上下文没有定期更新,它可能比没有上下文更糟糕。系统需要明确的信息刷新和验证策略。
  • 上下文冲突当不同的来源提供相互矛盾的信息时,人工智能模型会苦苦挣扎。好的上下文工程包括冲突解决机制和明确的信任等级制度。
  • 隐私问题更多的上下文通常意味着更多的敏感数据。系统必须在全面上下文与适当的隐私保护和数据管理之间取得平衡。

展望:人工智能交互的未来

这种转变具有深远的影响。随着上下文工程的成熟,我们将看到:

  • 真正从每次交互中学习的人工智能
  • 能够预测需求在被表达之前的系统
  • 不同人工智能代理之间的无缝交接
  • 使人工智能感觉像人类能力的自然延伸的集成

今天投资上下文工程的组织正在为人工智能系统奠定基础,这些系统不仅能回答问题,还能成为复杂工作的真正合作伙伴。

不同受众的关键要点

  • 开发人员上下文工程需要超越个别功能,思考整个系统。仅仅优化提示是不够的;您需要设计信息流,设计存储系统,并创建智能检索机制。
  • 商业领导者在评估人工智能解决方案时,不要仅仅看令人印象深刻的演示。问问系统如何随着时间的推移处理上下文,问问它如何在会话之间和不同用户之间处理上下文。最可持续的竞争优势将来自于更好的上下文工程,而不仅仅是更好的提示。
  • 最终用户了解上下文工程有助于设定合理的期望。当人工智能似乎“知道”您需要什么时,请欣赏在幕后工作的复杂系统。当它失败时,请认识到限制可能在于上下文,而不是智慧。

结论

从提示工程到上下文工程的演变反映了人工智能技术的更广泛成熟。就像早期的网站从静态页面演变成动态应用程序一样,人工智能也从巧妙的响应者演变成真正理解和适应我们需求的智能系统。

提示工程给了我们解锁人工智能潜力的钥匙。上下文工程正在构建使人工智能在复杂的现实场景中真正有用的整个基础设施。随着我们继续这段旅程,成功将属于那些理解未来不仅仅是问更好的问题,而是构建深刻理解我们需求全部上下文的系统的人。

提示只是开始。上下文是未来。

上下文工程FAQ

上下文工程如何超越人工智能系统中的提示工程?

上下文工程构建整个信息生态系统,动态地为人工智能提供相关数据、工具和记忆,而提示工程则专注于优化指令的措辞。

为什么上下文的质量比单独的提示设计更为关键?

即使是完美设计的提示也会失败,如果人工智能缺乏基本的背景信息——比如让新员工处理复杂任务而不提供公司系统、政策、产品信息和客户交互历史的访问权限。

有效上下文工程的关键组件是什么?

有效的上下文工程将系统指令、对话历史、长期记忆、实时数据检索(RAG)、工具定义、结构化输出和工作流状态结合成一个连贯的信息架构。

动态上下文系统如何提高人工智能代理的可靠性和成功率?

动态上下文系统可以通过在每个决策点自动提供相关信息来防止常见的故障,减少幻觉,并使人工智能能够处理静态提示无法支持的复杂多步骤任务。

结构化和策划信息如何影响人工智能任务的性能?

结构良好的上下文消除了信息过载和冲突,使人工智能能够快速访问所需的信息,同时过滤掉噪音,大大提高了响应的准确性并减少了处理时间。

Alex McFarland 是一名人工智能记者和作家,探索最新的人工智能发展。他曾与世界各地的众多人工智能初创公司和出版物合作。