Connect with us

人工智能

AI 推理的演进:从链式到迭代和分层策略

mm

在过去的几年中,链式推理已经成为大型语言模型中推理的核心方法。通过鼓励模型“大声思考”,研究人员发现,逐步解释可以提高数学和逻辑等领域的准确性。然而,随着任务变得更加复杂,链式推理的局限性变得明显。链式推理对仔细选择的推理示例的依赖使其难以处理过于简单或比示例更困难的任务。虽然链式推理引入了结构化思维到语言模型中,但该领域现在需要新的方法来处理复杂的、多步骤的问题和不同复杂度的问题。因此,研究人员现在正在探索新的策略,例如迭代和分层推理。这些方法旨在使推理更深入、更高效和更强壮。本文解释了链式推理的局限性,探索了链式推理的演进,并研究了应用、挑战和未来方向,以扩大AI推理的规模。

链式推理的局限性

链式推理帮助模型通过将任务分解为较小的步骤来处理复杂的任务。这种能力不仅提高了数学竞赛、逻辑谜题和编程任务的基准结果,还提供了一些透明度,通过暴露中间步骤。尽管有这些好处,链式推理并非没有挑战。研究表明,链式推理在需要符号推理或精确计算的问题上效果最佳。然而,对于开放式问题、常识推理或事实回忆,它通常添加很少或甚至降低准确性。

链式推理本质上是线性的。模型生成一个单一的步骤序列,导致答案。这种方法适用于短、明确定义的问题,但在任务需要更深入的探索时,会遇到困难。另外,复杂推理通常涉及分支、回溯和重新检查假设。单一的线性链无法捕捉到这一点。如果模型在早期犯了错误,所有后续步骤都会崩溃。即使推理是正确的,线性输出也无法适应新信息或重新检查早期假设。现实世界的推理需要灵活性,而链式推理无法提供。

研究人员还强调了扩展问题。随着模型面临更难的任务,链式推理变得更长、更脆弱。采样多个链式推理可以帮助,但它很快变得低效。问题是如何从狭窄的单一路径推理转向更强大的策略。

迭代推理作为下一步

一个有前途的方向是迭代。模型不再一次性产生最终答案,而是参与推理、评估和改进的循环。这反映了人们解决困难问题的方式,即先草拟一个解决方案,检查它,找出弱点,并一步步改进它。

迭代方法允许模型从错误中恢复并探索替代解决方案。它们创建一个反馈循环,模型可以批判自己的推理,或者多个模型可以相互批判。一个强大的想法是自一致性。模型不再相信单一的链式推理,而是采样多个推理路径,然后选择最常见的答案。这模仿了学生尝试多种方法解决问题,然后相信答案的过程。研究表明,聚合多个推理路径可以提高可靠性。最近的工作将这一想法扩展到结构化迭代中,输出被反复检查、纠正和扩展。

这种能力还使模型能够使用外部工具。迭代使得将搜索引擎、求解器或内存系统集成到循环中变得更容易。模型不再提交单一答案,而是可以查询外部资源、重新检查推理并修订步骤。迭代将推理转变为一个动态过程,而不是静态链式。

分层方法处理复杂性

仅仅迭代是不够的,当任务变得非常大时。对于需要长时间范围或多阶段规划的问题,分层变得至关重要。人类使用分层推理来解决问题。我们将任务分解为子问题,设定目标,并通过结构化的层次来解决它们。模型需要相同的能力。

分层方法允许模型将任务分解为较小的步骤,并并行或顺序地解决它们。关于思维程序思维树的研究强调了这一方向。推理不再是一个平面的链式,而是组织为树或图,其中可以探索和修剪多个路径。这使得可以搜索不同的策略并选择最有前途的策略。在这一方向上,一个新的发展是思维森林框架,它同时启动多个推理“树”,并使用一致性和错误纠正来处理它们。每棵树可以探索不同的路径;看起来不太有前途的树会被修剪,而自我纠正机制可以让模型发现和纠正任何分支中的错误。通过组合所有树的投票,模型做出集体决策。

分层还可以实现协调。大的任务可以分配给处理问题不同部分的代理。一个代理可能专注于规划,另一个代理专注于计算,另一个代理专注于验证。结果可以集成到一个连贯的单一解决方案中。早期的多代理推理实验表明,这种劳动分工可以优于单链式方法。

验证和可靠性

迭代和分层策略的另一个优势是,它们自然允许验证。链式推理暴露推理步骤,但它不能保证正确性。迭代循环允许模型检查自己的步骤或让其他模型检查它们。分层允许不同层次独立验证。

这为结构化评估管道打开了大门。例如,模型可能在较低层次生成候选解决方案,而较高层次的控制器选择或改进它们。或者外部验证器可以在接受之前将输出测试与约束进行比较。这些机制使推理变得不那么脆弱,更加可靠。

验证不仅仅是关于准确性。它还提高了可解释性。通过将推理组织成层次或迭代,研究人员可以更容易地检查哪里发生了故障。这支持调试和对齐,为开发人员提供了更多对模型推理的控制。

应用

先进的推理策略已经在各个领域得到应用。在科学领域,它们支持高级数学和研究提案的解决方案。在编程中,模型现在在竞争性编码、调试和完整的软件开发周期中表现良好。

法律和商业领域从复杂的合同分析和战略规划中受益。代理AI系统将推理与工具使用相结合,管理跨API、数据库和Web的多步骤操作。在教育领域,辅导系统可以逐步解释概念并提供个性化的指导。

挑战和开放问题

尽管迭代和分层方法具有前景,但仍然存在许多挑战需要解决。一个挑战是效率。迭代循环和树搜索可能计算成本高。平衡彻底性和速度是一个开放问题。

另一个挑战是控制。确保模型遵循有用的策略,而不是陷入无效循环,很困难。研究人员正在探索使用启发式、规划算法或学习控制器来引导推理的方法,但该领域仍然处于早期阶段。

评估也是一个开放问题。传统的准确性基准只能捕捉结果,而不是推理过程的质量。新的评估框架是必要的,以衡量推理策略的强壮性、适应性和透明度。

最后,还有对齐问题。迭代和分层推理可能会放大模型的优点和缺点。虽然它们可以使推理更加可靠,但也使得预测模型在开放式场景中的行为变得更加困难。需要仔细的设计和监督来避免新的风险。

结论

链式推理为AI推理打开了结构化推理的大门,但其线性局限性是明显的。未来在于迭代和分层策略,它们使推理更加适应性、可验证和可扩展。通过使用改进和分层问题解决的循环,AI可以从脆弱的逐步链式转变为强大的、动态的推理系统,能够处理现实世界的复杂性。

Dr. Tehseen Zia 是 COMSATS University Islamabad 的终身副教授,拥有来自奥地利维也纳科技大学的人工智能博士学位。专攻人工智能、机器学习、数据科学和计算机视觉,他在著名的科学期刊上发表了重要贡献。 Dr. Tehseen 还作为首席调查员领导了各种工业项目,并担任人工智能顾问。