【Science】超越阿尔法折叠:人工智能设计创造新的蛋白质
导读 | 在过去的两年中,机器学习革命性地改变了人们对蛋白质结构的预测。如今,发表于《科学》(Science)杂志的三篇论文向我们展示了蛋白质设计领域的类似革命。 |
在这些新研究中,华盛顿大学医学院的生物学家表示,利用机器学习,人们可以比以往更精准、更快速地创造蛋白质分子。研究者希望这一进展将能促进相关新疫苗、新治疗策略、碳捕获工具和可持续生物材料的研发。
该研究资深作者、华盛顿大学医学院生物化学教授David Baker表示:“蛋白质是生物学的基础。然而目前,我们在每种植物、动物和微生物中发现的所有蛋白质,远远未到其可能性上限的百分之一。借助这些新型软件工具,研究人员将能够找到办法来应对医学、能源和技术领域所面临的长期挑战。” David Baker也是2021年生命科学突破奖(Breakthrough Prize in Life Sciences)的获得者。
蛋白质设计者——ProteinMPNN
01
蛋白质通常被称为“生命的基石”,因为它们对所有生物的结构和功能都是必不可少的:蛋白质几乎参与了细胞内发生的每一个过程,包括细胞的生长、分裂和修复。蛋白质由被称为氨基酸的长链化学物质组成;这些氨基酸的顺序也决定了蛋白质的三维形状,进而影响蛋白质功能——蛋白质的复杂形状与蛋白质功能紧密相联。
最近,例如AlphaFold和RoseTTAFold等强大机器学习算法,已经被训练成可以仅凭氨基酸序列来预测天然蛋白质的详细情况。机器学习是一种人工智能,它允许计算机在没有明确编程的情况下从数据中学习。机器学习可用于模拟人类难以理解的复杂科学问题。
然而,Baker教授及其团队成员却有着更大的愿景——超越自然界中发现的蛋白,来设计蛋白质。团队成员将蛋白质设计的挑战分解为三个部分;并为每个部分问题的解决,配置了新的软件解决方案。
首先,科学家需要一种新的蛋白质形状。在7月21日发表在《科学》(Science)杂志上的一篇论文中,该研究团队向人们展示:人工智能可以通过两种方式产生新蛋白质形状。第一种方式被称为“幻觉(hallucination)”,它类似于DALL-E或其他生成性的(generative)人工智能工具——这些工具根据简单的提示(prompts)来输出新蛋白质形状。第二种方式称为“内画/图像修补(inpainting)”,其工作原理类似于现代搜索栏中的自动完成功能。
人工智能能“幻觉”这些对称的蛋白质组装,其工作方法类似于其他生成性的(generative)人工智能工具——这些工具根据简单的提示(prompts)来输出新蛋白质形状。
其次,为了加快上述过程,该研究团队设计了一种新算法,用以生成氨基酸序列。相关研究结果于9月15日发表于《科学》(Science)杂志——名为“ProteinMPNN”的软件工具可以在1秒钟内开始运作,比之前最强大的软件快200多倍;ProteinMPNN的运行结果也更优秀(superior),且不需要专家自定义(expert customization)即可运行。
https://www.science.org/doi/10.1126/science.add2187
项目科学家、蛋白质设计研究所的博士后研究员Justas Dauparas表示:“如果有大量的数据,那么我们将很容易训练神经网络;但是对于蛋白质而言,我们没有我们想要的那么多的数据和例子。我们必须深入这些分子内部,并确定其哪些特征是最重要的。这有点类似于反复试错法(trial and error)。”
第三,该团队使用AlphaFold(由DeepMind开发)来进行独立评估——评估他们提出的氨基酸序列是否有可能折叠成预期的蛋白质形状。
评估结果表明,ProteinMPNN工具在计算机和实验测试中都具有出色的性能。在天然蛋白质骨架上,ProteinMPNN的序列回收率为52.4%,而Rosetta的序列回收率为32.9%。不同位置的氨基酸序列可以在单链或多条链之间偶联,从而能被应用于解决当前蛋白质设计所面临的各种挑战。
此外,研究团队通过挽救以前失败的蛋白质单体、环状同聚物、四面体纳米颗粒和靶结合蛋白的设计,证明了 ProteinMPNN 的广泛效用和高精度。
EalionMPNN快速工具设计的蛋白质的细节,
这是在蛋白质设计中使用人工智能和机器学习的又一进步。
超越AlphaFold,
创造更具活力和功能性的蛋白质
02
Dauparas教授解释说:“用于预测蛋白质结构的软件(例如AlphaFold)是解决方案的一部分;但它们无法自己产出新的事物。”
David Baker教授补充道:“ProteinMPNN在蛋白质设计领域功能十分强大,正如AlphaFold在蛋白质结构预测领域的强大功能一样。”
在9月15日发表在《科学》(Science)杂志上的另一篇论文中,Baker教授实验室的一个团队证实,不同新的机器学习工具的组合,能可靠地产生在实验室中起作用的新蛋白质。
项目科学家、蛋白质设计研究所的博士后研究员Basile Wicky 表示:“我们发现使用ProteinMPNN制成的蛋白质更有可能按预期折叠,我们可以使用这些方法创建非常复杂的蛋白质组装。”
这些新制造的蛋白质是纳米尺度的环状物。研究人员认为,这些环状物可以成为纳米机器的一部分。在电子显微镜的观察下,它们的直径比罂粟种子小十亿倍。
Baker.教授表示:“这是机器学习在蛋白质设计中的开端。在接下来的几个月里,我们将努力改进这些工具,以创造更具活力和功能性的蛋白质。”(转化医学网360zhyx.com)
参考资料:
https://phys.org/news/2022-09-alphafold-ai-excels-proteins.html
注:本文旨在介绍医学研究进展,不能作为治疗方案参考。如需获得健康指导,请至正规医院就诊。
还没有人评论,赶快抢个沙发