人工智能

代理实验室：AMD 和约翰霍普金斯大学共同组建的虚拟研究团队

发布时间 2025 年 1 月 13 日

亚历克斯麦克法兰

Schmidgall 等人

虽然大家都在热议 AI代理商和自动化领域，AMD 和约翰霍普金斯大学一直致力于改善人类和人工智能在研究中的协作方式。他们的新开源框架代理实验室，彻底重新构想了如何通过人机合作来加速科学研究。

在考察了众多人工智能研究框架之后，Agent Laboratory 因其务实的方法脱颖而出。它并非像许多现有解决方案那样试图取代人类研究人员，而是专注于增强人类研究人员的能力，处理研究中耗时的部分，同时保持人类的主导地位。

这里的核心创新简单但功能强大： 代理实验室并不追求完全自主的研究（这通常会导致可疑的结果），而是创建一个虚拟实验室，让多个专门的人工智能代理协同工作，每个代理处理研究过程的不同方面，同时坚持人类的指导。

虚拟实验室剖析

可以将 Agent Laboratory 视为一个精心组织的研究团队，但其中的 AI 代理会扮演专门的角色。就像真正的研究实验室一样，每个代理都有特定的职责和专长：

博士代理处理文献综述和研究规划
博士后代理帮助改进实验方法
ML 工程师代理负责技术实施
教授代理对研究成果进行评估和评分

该系统尤其引人入胜之处在于其工作流程。与传统孤立运行的AI工具不同，Agent Laboratory创建了一个协作环境，让这些代理能够相互交互，并基于彼此的工作成果进行构建。

该过程遵循自然的研究进程：

文献评论： 博士代理使用 arXiv API，收集和组织相关研究
方案制定： 博士和博士后代理团队制定详细研究计划
实施： ML 工程师代理编写和测试代码
分析与文献： 团队共同解释结果并生成综合报告

但它的真正实用性体现在以下方面： 该框架具有计算灵活性，这意味着研究人员可以根据其计算能力和预算限制来分配资源。这使它成为专为实际研究环境设计的工具。

Schmidgall 等人

人为因素：人工智能与专业知识的交融

虽然 Agent Laboratory 拥有令人印象深刻的自动化功能，但真正的魔力在于他们所谓的“副驾驶模式”。在这种设置下，研究人员可以在流程的每个阶段提供反馈，从而在人类专业知识和人工智能协助之间建立真正的协作。

副驾驶反馈数据揭示了一些令人信服的见解。在自主模式下，Agent Laboratory 生成的论文在人工评估中的平均得分为 3.8/10。但当研究人员采用副驾驶模式时，这些分数跃升至 4.38/10。特别有趣的是这些改进表现在哪里——论文在清晰度（+0.23）和呈现（+0.33）方面的得分明显更高。

但现实是这样的： 即使有人工参与，这些论文的得分仍然比平均分数低 1.45 分神经网络信息系统论文（得分为 5.85）。这不是失败，而是关于人工智能和人类专业知识如何相互补充的重要学习。

评估结果还揭示了一些有趣的事情： AI 审阅者对论文的评分始终比人类审阅者高出 2.3 分。这一差距凸显了为什么人类监督在研究评估中仍然至关重要。

Schmidgall 等人

分解数字

在研究环境中真正重要的是什么？成本和性能。Agent Laboratory 的模型比较方法揭示了这方面一些令人惊讶的效率提升。

GPT-4o 成为速度冠军，仅用 1,165.4 秒就完成了整个工作流程——比 o3.2-mini 快 1 倍，比 o5.3-preview 快 1 倍。更重要的是，每篇论文的成本仅为 2.33 美元。与之前成本约为 15 美元的自主研究方法相比，我们预计成本将降低 84%。

查看模型性能：

o1-preview 在实用性和清晰度方面得分最高
o1-mini 取得了最佳实验质量分数
GPT-4o 在指标上落后，但在成本效率上领先

这对现实世界有着重大的影响。

研究人员现在可以根据自己的特定需求选择方法：

需要快速制作原型？GPT-4o 提供速度和成本效益
优先考虑实验质量？o1-mini 可能是你最好的选择
寻找最精致的输出？o1 预览版前景看好

这种灵活性意味着研究团队可以根据他们的资源和要求调整框架，而不是被锁定在一个千篇一律的解决方案中。

研究的新篇章

在研究了 Agent Laboratory 的能力和成果后，我确信我们正在见证研究方式的重大转变。但这并非经常占据头条新闻的“替代”论调——而是更加微妙、更加有力的论调。

虽然 Agent Laboratory 的论文本身尚未达到顶级会议的标准，但它们正在为加速研究创造一种新的范式。这就像拥有一支永不眠息的 AI 研究助理团队，每个人都专注于科学研究的不同方面。

这对研究人员的影响是深远的：

花费在文献综述和基本编码上的时间可以用于创意构思
由于资源限制而被搁置的研究想法变得可行
快速制作原型并测试假设的能力可能会带来更快的突破

当前的限制，例如人工智能和人类评分之间的差距，都是机遇。这些系统的每次迭代都让我们更接近人类和人工智能之间更复杂的研究合作。

展望未来，我认为有三个关键发展可能重塑科学发现：

随着研究人员学会有效利用这些工具，将会出现更复杂的人机协作模式
成本和时间的节省可以使研究更加民主化，使小型实验室和机构能够开展更雄心勃勃的项目
快速原型制作能力可以带来更多的研究实验方法

最大化这一潜力的关键是什么？要明白 Agent Laboratory 和类似的框架是用于放大的工具，而非自动化。未来的研究并非在人类专业知识和人工智能能力之间做出选择，而是要找到将它们结合起来的创新方法。

联合人工智能

代理实验室：AMD 和约翰霍普金斯大学共同组建的虚拟研究团队

虚拟实验室剖析

人为因素：人工智能与专业知识的交融

分解数字

研究的新篇章

你可能会喜欢