思想领袖
从代码到治愈:下一个 AI 革命需要一只手(和眼睛)

如何让代理系统、XR 智能眼镜和机器人赋予人类力量——而不是取代他们
我们正在经历人工智能的一个悖论。
在屏幕上,AI 是超人的。大量语言模型可以在几秒钟内编写功能性 Python 代码。生成系统可以在几分钟内生成逼真图像和视频。诺贝尔奖获奖系统如 AlphaFold 已经预测了几乎所有已知蛋白质的结构。数字化的胜利正在不断积累。
然而,在生物医学研究的物理世界中,发现的过程仍然是非常手动的。我们并没有真正地感觉到 AI 加速科学或医学的进展,至少现在还没有。数字表明了问题的深度。自然杂志的一项具有里程碑意义的调查显示,超过 1,500 名科学家中,有超过 70% 尝试并失败地复制了其他研究人员的实验。更令人担忧的是:超过一半的科学家无法复制自己的工作。在癌症生物学中,一个为期八年的可复制性项目发现,只有 40% 的高影响力发现可以被复制,68% 的实验缺乏足够的文档记录,甚至无法尝试复制。
这是现代科学的一个肮脏秘密:我们有一个知识捕获问题,而不仅仅是一个发现问题。关键的实验细节存储在研究人员的头脑中,而不是在论文中。协议会发生变化。默示知识会随着研究生毕业而离开。训练在已发表文献上的 AI 系统继承了所有这些差距。
根本问题是,虽然 AI 可以在数字模拟中设计一种用于癌症治疗的新型蛋白质,但它无法捡起一个移液管来测试它。它无法在湿实验室中导航,以验证自己的假设。它无法观察一位经验丰富的科学家的双手,并学习使实验成功的微妙技巧。
这种“执行差距”是阻止 AI 革命成为医学革命的最大瓶颈。虽然大多数机器人公司仍忙于教机器折叠衣服或装载洗碗机,但它们在诸如医学等领域落后于这些进步的真正变革能力。
为了解决这个问题,我们必须超越聊天机器人,朝着 AI 合作者发展,代理系统可以连接数字世界和物理世界,超越规划和编码,进入现实世界的执行。在斯坦福大学,我们正在开发 LabOS,一种数字-物理 AI 框架,展示了如何让 AI 代理、XR 智能眼镜和协作机器人联合起来关闭这个循环,将科学实验转化为人类和机器之间的协作对话,同时自动捕获当前丢失的知识。
巨大鸿沟:为什么 AI 需要“眼睛”和“手”
许多最显著的 AI 成功发生在环境完全数字化的地方:代码仓库、整理数据集或模拟基准(其中 AI 竞争运行虚拟业务或数字投资股票)。
湿实验室是不同的。生物学,总的来说,科学发现是一个非常嘈杂的过程。仪器会漂移,操作员会即兴发挥,“协议”往往部分地存在于人们的脑海中。干净的结果和失败的运行之间的区别可能是一个移液角度、一个旋涡模式、一个替代的试剂或一个长达 10 分钟的孵化。这些上下文细节很少出现在一篇论文中,它们正是 AI 模型需要的,如果它要推广到数据集之外。
这就是为什么实验室级别的 AI 需要眼睛(来感知发生了什么),需要手(来标准化和自动化高变异步骤),需要记忆(来记录实际发生了什么)。没有这些能力,模型可以推荐要做什么,但它们无法可靠地将推荐转化为经过验证的物理执行或解释当现实与计划偏离时的失败。
超越聊天机器人:从副驾驶到合作者
“代理 AI”这个术语有时被松散地使用。在生物医学环境中,它应该意味着某种具体的东西:一个可以分解目标(例如“优化 CRISPR 基因编辑效率,同时最小化非目标位点”)为任务序列、跨工具执行这些任务、评估结果并在约束和可审计的决策下适应计划的系统。
这很重要,因为研究工作流程不仅仅是一个模型调用。它们是从假设制定、实验设计、数据处理、统计测试到解释的端到端管道。最近在药物发现方面的思考开始强调代理系统,可以扩大这些管道,而不仅仅是加速个别步骤(例如,Unite.AI 关于小分子发现中的代理的讨论)。
在软件工程中,我们已经看到早期的实证证据,即 AI 副驾驶可以增加开发人员的生产力。在生物医学领域,类似的机会不仅仅是编写代码,而是编写和验证协议、结构化数据、监控执行并在预测和测量之间关闭循环,将 AI 连接到实验室中的人类科学家。
LabOS:当 AI 运行在实验室操作系统上
在斯坦福大学的 AI4Science 工作中,跨越基因编辑副驾驶(如 CRISPR-GPT)和 AI-XR 协同执行系统(如 LabOS),我们一直在探索一个架构转变:
1. 设计一个端到端的“实验室操作系统”,将数字(干)实验室连接到物理(湿)实验室。
前提很简单:如果实验室笔记本是科学的记忆,那么实验室操作系统应该是执行层,捕获意图,翻译成行动,观察结果,并将每次运行转化为结构化的知识。
[…]
请注意,完整的内容太长,无法在此处显示。上述内容是根据您的要求进行的翻译,保持了相同的结构和格式。如果您需要完整的翻译内容,请告知,我将提供给您。












