环球快资讯:三篇Science论文指出人工智能可以比以前更准确和更快速地用来构建蛋白分子

来源:生物谷原创 | 2022-09-22 17:37:23 |

在过去的两年里,机器学习已经彻底改变了蛋白结构预测。如今,发表在Science期刊上的三篇论文描述了在蛋白设计中取得了里程碑式进展。在这些新的论文中,来自美国华盛顿大学医学院的研究人员指出机器学习可以比以前更准确和更快速地用来构建蛋白分子。他们希望这一进展将带来许多新的疫苗、治疗方法、碳捕获工具和可持续生物材料。

美国华盛顿大学医学院生物化学教授和2021年生命科学突破奖获得者David Baker说,“蛋白是整个生物学的基础,但我们知道,在每一种植物、动物和微生物中发现的所有蛋白所占的比例远远不到百分之一。有了这些新的软件工具,科学家们应该能够为医学、能源和技术领域的长期挑战找到解决方案。”


(相关资料图)

蛋白通常被称为“生命的基石”,因为它们对所有生物的结构和功能至关重要。它们参与了细胞内发生的几乎所有过程,包括生长、分裂和修复。蛋白是由称为氨基酸的化学长链构成的。蛋白中的氨基酸序列决定了其三维形状。这种复杂的形状对于蛋白的功能至关重要。

最近,包括AlphaFold和RoseTTAFold在内的强大的机器学习算法经训练后可以完全根据氨基酸序列预测天然蛋白的详细形状。机器学习是一种人工智能,它允许计算机从数据中学习,而无需明确编程。机器学习可用于对人类难以理解的复杂科学问题进行建模。

为了超越自然界中发现的蛋白,Baker团队成员将蛋白设计的挑战分解为三个部分,并针对每个部分使用新的软件解决方案。

首先,必须生成一种新的蛋白形状。在第一篇论文中,Baker团队指出人工智能可以通过两种方式生成新的蛋白形状。第一种方法被称为幻化(hallucination),类似于DALL-E或其他根据简单的提示产生输出的生成型人工智能工具。第二种方法被称为“图像修复(inpainting)”,类似于现代搜索栏中的自动完成功能。相关研究结果发表在2022年7月22日的Science期刊上,论文标题为“Scaffolding protein functional sites using deep learning”。

其次,为了加速这一过程,Baker团队设计了一种新的算法来生成氨基酸序列。在第二篇论文中,他们描述了这种称为ProteinMPNN的软件工具,它的运行时间约为一秒。这比以前最好的软件快200多倍。其结果优于之前的工具,而且该软件不需要专家定制就能运行。相关研究结果于2022年9月15日在线发表在Science期刊上,论文标题为“Robust deep learning–based protein sequence design using ProteinMPNN”。

华盛顿大学蛋白设计研究所博士后研究员Justas Dauparas说,“如果有大量的数据,可以很容易对神经网络进行训练,但是对于蛋白,我们没有想要的那么多例子。我们不得不进入并确定这些分子中哪些特征是最重要的。这是有点像尝试错误的方法。”

第三,Baker团队使用Alphabet旗下DeepMind公司开发的工具AlphaFold,独立评估他们得出的氨基酸序列是否有可能折叠成预定的形状。

Dauparas解释说,“预测蛋白结构的软件是解决方案的一部分,但它自己不能提出任何新的东西。”Baker补充说,“ProteinMPNN对于蛋白设计来说,就像AlphaFold对于蛋白结构预测一样。”

在第三篇论文中,Baker团队证实组合使用新的机器学习工具能够可靠地生成在实验室中发挥作用的新蛋白。相关研究结果于2022年9月15日在线发表在Science期刊上,论文标题为“Hallucinating symmetric protein assemblies”。

华盛顿大学蛋白设计研究所博士后研究员Basile Wicky说,“我们发现利用ProteinMPNN制造的蛋白更有可能按照预期折叠起来,而且我们可以使用这些方法构建非常复杂的蛋白组装体。”

在制作的新蛋白中,有一些纳米大小的环,这些作者认为它们可以成为定制纳米机械的部件。电子显微镜被用来观察这些直径大约比罂粟种子小十亿倍的环。

Baker说,“这是机器学习在蛋白设计中的开始。在未来几个月里,我们将努力改进这些工具,以构建出更加动态和功能性的蛋白。”(生物谷 Bioon.com)

参考资料:

1. Jue Wang et al. Scaffolding protein functional sites using deep learning. Science, 2022, doi:10.1126/science.abn2100.

2. J. Dauparas et al. Robust deep learning based protein sequence design using ProteinMPNN. Science, 2022, doi:10.1126/science.add2187.

3. B.I.M.Wicky et al. Hallucinating symmetric protein assemblies. Science, 2022, doi:10.1126/science.add1964.

4. Beyond AlphaFold: AI excels at creating new proteinshttps://phys.org/news/2022-09-alphafold-ai-excels-proteins.html