> 文章列表 > 超越AlphaFold:AI擅长创造新的蛋白质

超越AlphaFold:AI擅长创造新的蛋白质

超越AlphaFold:AI擅长创造新的蛋白质

在过去的两年里,机器学习彻底改变了蛋白质结构预测。现在,《科学》杂志上的三篇论文描述了蛋白质设计中的类似革命。

在新论文中,华盛顿大学医学院的生物学家表明,机器学习可以用来比以前更准确、更快速地创建蛋白质分子。科学家们希望这一进展将导致许多新的疫苗,治疗方法,碳捕获工具和可持续的生物材料。

“蛋白质是生物学的基础,但我们知道,在每种植物、动物和微生物中发现的所有蛋白质都远远不到百分之一。有了这些新的软件工具,研究人员应该能够找到解决医学、能源和技术领域长期挑战的解决方案,“资深作者、华盛顿大学医学院生物化学教授、2021 年生命科学突破奖获得者大卫贝克说。

蛋白质通常被称为“生命的基石”,因为它们对所有生物的结构和功能都是必不可少的。它们几乎参与细胞内发生的每一个过程,包括生长、分裂和修复。蛋白质由称为氨基酸的长链化学物质组成。蛋白质中的氨基酸序列决定了其三维形状。这种复杂的形状对于蛋白质的功能至关重要。

最近,包括AlphaFold和RoseTTAFold在内的强大的机器学习算法已被训练,可以仅根据氨基酸序列来预测天然蛋白质的详细形状。机器学习是一种人工智能,它允许计算机从数据中学习,而无需明确编程。机器学习可以模拟人类难以理解的复杂科学问题。

为了超越自然界中发现的蛋白质,Baker的团队成员将蛋白质设计的挑战分为三个部分,并为每个部分使用新的软件解决方案。

首先,必须生成新的蛋白质形状。在21月<>日发表在《科学》杂志上的一篇论文中,该团队表明,人工智能可以通过两种方式产生新的蛋白质形状。

第一种被称为“幻觉”,类似于DALL-E或其他基于简单提示产生输出的生成AI工具。第二个被称为“修复”,类似于现代搜索栏中的自动完成功能。

其次,为了加快这一过程,该团队设计了一种生成氨基酸序列的新算法。在15月200日的《科学》杂志上描述,这个名为ProteinMPNN的软件工具在大约一秒钟内运行。这比以前最好的软件快 <> 多倍。它的结果优于以前的工具,并且该软件不需要专家定制即可运行。

“如果你有大量的数据,神经网络很容易训练,但对于蛋白质,我们没有我们想要的那么多的例子。我们必须进入并确定这些分子中的哪些特征是最重要的。这是一个反复试验的过程,“项目科学家Justas Dauparas说,他是蛋白质设计研究所的博士后研究员。

第三,该团队使用Alphabet的DeepMind开发的工具AlphaFold来独立评估他们提出的氨基酸序列是否可能折叠成预期的形状。

“用于预测蛋白质结构的软件是解决方案的一部分,但它无法自行提出任何新的东西,”Dauparas解释说。

“ProteinMPNN之于蛋白质设计,就像AlphaFold之于蛋白质结构预测一样,”Baker补充道。

在15月<>日发表在《科学》杂志上的另一篇论文中,贝克实验室的一个研究小组证实,新的机器学习工具的组合可以可靠地产生在实验室中起作用的新蛋白质。

“我们发现使用ProteinMPNN制造的蛋白质更有可能按预期折叠,我们可以使用这些方法创建非常复杂的蛋白质组装,”项目科学家Basile Wicky说,他是蛋白质设计研究所的博士后研究员。

在制造的新蛋白质中,研究人员认为纳米级环可以成为定制纳米机器的部件。电子显微镜被用来观察环,其直径大约比罂粟种子小十亿倍。

“这是机器学习在蛋白质设计中的开端。在接下来的几个月里,我们将努力改进这些工具,以创造更具活力和功能性的蛋白质,“贝克说。

微软和亚马逊网络服务为这项工作捐赠了计算机资源。

网赚资料