【Science】震撼发布:DeepMind开源AlphaFold3代码,引领AI蛋白质预测革命!
导读 | 谷歌DeepMind 于11月11日发布了其最新人工智能(AI)蛋白质预测软件的基础计算机代码,供急切的研究社区使用。 |
2024年11月11日,Catherine Offord在期刊《Science》上发表了题为“Google DeepMind releases code behind its most advanced protein prediction program”的文章。
https://www.science.org/content/article/google-deepmind-releases-code-behind-its-most-advanced-protein-prediction-program
关于AlphaFold3
01
当DeepMind在5月8日的《自然》杂志上宣布AlphaFold3时,研究人员赞扬了这项技术不仅能预测蛋白质的结构,还能预测它们如何与DNA、RNA和其他蛋白质相互作用,这对药物发现和其他领域是一个福音。但他们批评了这一宣布本身:尽管《自然》杂志的编辑指南规定,计算代码必须与发表的研究一起提供,但新论文只包含了“伪代码”——程序运行的步骤列表——以及一个在线门户的链接,允许科学家每天进行有限数量的预测。
这种做法与DeepMind在2021年在《自然》杂志上发表的AlphaFold2的完整代码的做法形成对比,并与开放性、可复制性和同行评审的公认标准背道而驰,研究人员在一封公开信中争辩,这封信获得了数百个签名。在受到批评后,DeepMind承诺在论文发表后的6个月内发布完整的代码供非商业用途使用。现在,它兑现了这一承诺。计算模型本身已经在代码库GitHub上以非商业许可证公开,而“权重”——帮助调整AI模型工作的数字——可供完成简短申请表的学者使用。
AlphaFold3代码开源的争议
02
DeepMind的科学副总裁Pushmeet Kohli表示:“我们要感谢社区的耐心。”尽管他和他的同事坚持他们发布程序的方式,但Kohli表示,他们认识到社区希望直接使用代码的愿望。他补充说,为公开发布准备和测试模型,已经花了几个月的时间。
研究人员对此举表示欢迎。斯德哥尔摩大学的生物物理学家、公开信的签署者Erik Lindahl表示:“我对DeepMind团队遵守承诺发布代码感到高兴,因为这意味着终于可以开始对一篇重要论文进行深入审查了。”范德比尔特大学的计算结构生物学家、公开信的组织者Stephanie Wankowicz补充说:“发布的模型和权重,对于评估和构建工作的努力非常重要。”然而,她说,“6个月的延迟是不可接受的。”AlphaFold3是AlphaFold的最新版本,AlphaFold是基于其氨基酸序列仅预测蛋白质结构的AI,今年早些时候,它为DeepMind的两位研究人员John Jumper和Demis Hassabis赢得了诺贝尔化学奖的一半。然而,直到今天,研究人员只能通过DeepMind的在线门户使用该程序,该门户每天只允许10(现在是20)个请求,并且分子集合受限。
在5月的一份声明中,《自然》杂志的主编Magdalena Skipper没有具体说明为什么该杂志放弃了共享完整代码的要求,但表示编辑们考虑了“对生物安全的潜在影响,以及带来的伦理挑战”等因素。与此同时,《自然》杂志的一篇新闻报道引用了Kohli的话,暗示团队限制了对AlphaFold3的访问,以避免损害DeepMind的商业衍生公司Isomorphic Labs的药物发现计划的能力。
AlphaFold3与新药研发
03
一些研究团队已经计划使用AlphaFold3的代码。在《自然计算科学》上发表的一篇论文背后的团队描述了一个名为MassiveFold的程序,表示希望将AlphaFold3集成到其软件中。MassiveFold帮助用户利用并行计算,减少运行大量AlphaFold2预测所需的时间——可能从几个月减少到几小时。MassiveFold开发者、法国国家研究机构CNRS的生物信息学研究工程师Guillaume Brysbaert表示,通过集成DeepMind的新代码,“用户将能够从这种方法中,获得AlphaFold2或AlphaFold3的最佳预测。”
AlphaFold3 可以预测蛋白质的结构,例如,来自土壤微生物的这种酶,以及它们与其他分子的相互作用。
总结
04
1. DeepMind发布了AlphaFold3的完整计算机代码,供非商业用途使用,这是在社区批评和要求之后做出的决定。
2. AlphaFold3是一个先进的AI蛋白质预测软件,能够预测蛋白质结构及其与其他分子的相互作用,对药物发现等领域具有重要意义。
3. AlphaFold3的发布,可能会促进科学界对蛋白质结构预测方法的进一步研究和改进。研究人员对于DeepMind优先开发在线门户而不是发布代码的决定有不同的看法,一些人认为这限制了研究的开放性,而另一些则认为这对于计算能力有限的团队来说更实用。
4. 尽管现在发布了代码,但一些研究人员认为基于伪代码的替代实现仍然有价值,并且有助于方法的复制和未来的改进。一些研究团队计划将AlphaFold3的代码集成到他们的软件中,以提高预测效率和准确性。
还没有人评论,赶快抢个沙发