人工智能

适应生物革命性地使用生成式AI进行蛋白质工程

mm

诸如ChatGPT的AI工具正在以令人惊叹的方式改变文本、图像和代码的生成。同样,机器学习算法和生成式AI正在破坏传统的生命科学方法,并加速药物发现和材料开发的时间表。

DeepMind的AlphaFold可能是该领域最著名的机器学习模型。它可以从氨基酸序列预测蛋白质的3D结构,并已被超过100万名研究人员在其公开发布后的18个月内使用。从那时起,出现了许多其他AI工具,包括最近开源的RFDiffusion,它允许研究人员仅使用笔记本电脑即可生成计算蛋白质设计。

然而,将这些计算设计转化为有形、功能性的蛋白质仍然是一个挑战。适应生物公司(Adaptyv Bio)旨在通过其下一代蛋白质工厂解决这个问题。通过集成先进的机器人技术、微流体技术和合成生物技术,适应生物公司正在构建一个全栈平台,以使蛋白质工程师能够验证他们的AI生成的蛋白质设计。

适应生物公司的CEO和联合创始人朱利安·恩格特(Julian Englert)表示:“蛋白质是生物革命的核心,无论是作为新药、改进的酶用于研究和工业应用,还是具有独特性质的材料。作为蛋白质设计师,您现在可以使用令人难以置信的新AI工具,如AlphaFold或RFDiffusion。但是,验证您在实验室中的蛋白质设计以查看它们是否有效仍然是一个巨大的挑战。”

AI模型在训练和改进其预测方面依赖于数据。通过简化生成有关设计蛋白质有效性的数据的过程,适应生物公司使蛋白质工程师和AI模型能够获得更多关于其设计的反馈,从而引导他们朝着更好的蛋白质设计方向发展。

恩格特补充说:“想象一下自动驾驶汽车中的AI。为了使汽车保持在道路上并到达目的地,AI模型需要通过汽车的摄像头传感器获得大量高质量的数据。同样的原理也适用于设计新蛋白质的AI模型,反馈机制涉及在我们的实验室中实际创建蛋白质并测试其性能。”

适应生物公司由来自瑞士联邦理工大学(EPFL)的工程师团队创立,他们的动力来自于在实验室中进行生物实验的耗时过程。2022年,他们从翼人风险投资公司(Wingman Venture)获得了250万美元的种子资金,之后参加了世界上最具选择性的创业加速器Y Combinator。该团队已扩大到12名工程师,拥有合成生物学、微工程、软件开发和机器学习等多样化的背景。该公司位于瑞士洛桑的新建生物极(Biopole)生命科学园区,在那里他们正在开发具有莱芒湖和瑞法阿尔卑斯山美景的尖端实验室设施中开发他们的技术。

适应生物公司的工厂围绕蛋白质工程工作单元展开——自定义、自动化的设置,能够将通常需要多台实验室设备的过程缩小到微流体芯片上进行。用户可以编写实验协议(或让AI编写),然后工作单元会自主执行实验,同时密切控制和监测实验参数。所有测量数据都会自动处理并上传,以便用户能够在每个实验中改进他们的机器学习模型。

恩格特说:“我们的工作单元是完全自动化的,使用的试剂比任何商业上可用的替代品少1000倍,我们可以在每个设置上每天运行成千上万种不同的蛋白质。为了简化实验工作流程,我们开发了许多自定义的合成生物学和自动化技术。在接下来的12个月内,我们计划进一步扩大我们的实验室,并增加我们可以支持的蛋白质设计应用程序的数量。我们刚刚为用户开放了早期访问权限,以便他们可以提交自己的蛋白质设计项目,我们正在尽快将新项目纳入我们的计划中。”

为了进一步加速蛋白质工程领域的发展,适应生物公司已经开源了两个内部工具,这些工具已经在该领域的研究人员和工程师中开始获得关注。 ProteinFlow 是一个Python库,允许蛋白质设计师轻松创建高质量的数据集,以改进AI模型。 Automancer 是一个可扩展的软件平台,用于运行自动化实验,允许研究人员构建自己的实验协议并集成不同的实验室仪器。

“我们的使命是让蛋白质工程变得更容易,并使更多的研究人员能够设计新的蛋白质。想想组成我们身体中每个细胞的令人难以置信的强大分子机制。想象一下,如果我们能够开始设计用于个性化药物、工业应用(如新的酶)或更好的、更可持续的材料的新蛋白质,人类可能会取得什么样的技术进步,” 朱利安·恩格特补充说。

Daniel 是一个大力提倡人工智能最终将颠覆一切的人。他呼吸着技术,活着就是为了尝试新的小工具。