AlphaFold在蛋白质构造预测竞赛中斩获第一

继围棋之后谷歌人工智能又有新打破!可加速新药研发_卵白质_团队 文字写作

在今年的蛋白质构造预测竞赛(下称“CASP”)中,AlphaFold程序击败别的近百支参赛团队得到第一,并达到了与实验室测试基本相称的准确性水平。

CASP竞赛每两年举办一次,被业界视为“蛋白质奥林匹克”。
主理方会面向环球发布未知的蛋白质序列,每个参赛团队利用自己设计的算法来预测其构造。
随后,主理方会将预测结果和实验室结果进行比较,并根据两者的靠近性给出0-100的得分。

根据CASP主席、马里兰大学教授约翰·莫尔特(John Moult )的说法,分数达到90 分旁边,就意味着这个算法具有和实验室方法一样的破解能力。

今年的CASP比赛已经是第14届。
Deepmind称AlphaFold拿下了92.4的均匀分,即便是在难度最大的寻衅中,AlphaFold的得分中位数也达到了87分。

据莫兰特先容道,在中等难度的蛋白质构造预测中,其他团队的最高得分为75分,而AlphaFold能够得到90分。

蛋白质靶标的两个示例,绿色为实验室结果,蓝色为打算机预测。
图自Deepmind。

早在2018年,AlphaFold首次参加CASP,就在98个参赛团队中名列榜首,准确地从43种蛋白质中预测出了25种蛋白质构造,而第二名的获奖团队仅准确预测出3种。

最新版本的AlphaFold算法不仅表现优于竞争对手,较18年参赛的旧版本相比也有长足进步。
图自《自然》官网。

蛋白质折叠问题已困扰科学家近50年

蛋白质为什么主要?DeepMind官网先容,蛋白质险些可以支持生命所有的功能,而蛋白质的浸染很大程度上取决其3D构造。

人类当前面临的许多寻衅,例如开拓新的疾病治疗方法或探求可分解工业废物的酶,都与蛋白质及其浸染密切干系。
确定蛋白质的形状和功能一贯是一个主要的研究领域,而在此前的研究中,每种蛋白质构造的确定可能要花费数年的艰巨事情,并且要利用数百万美元的专用设备。

弄清楚蛋白质会折叠成什么样,被称为“蛋白质折叠问题”。
“在过去将近50年的韶光里,我们一贯在试图解答这个问题。
“约翰·莫尔特说。

据《自然》宣布,研究职员此前普遍通过X射线、低温电子显微镜等实验技能来确定蛋白质的构造。
在80年代至90年代,研究职员曾利用打算机来预测蛋白质构造,但结果并不令人满意。

而AlphaFold可能会为科学家们供应解答这一问题的新思路。
德国图宾根马克斯·普朗克生物学研究所蜕变生物学家安德烈·卢帕斯(Andrei Lupas)已经带领团队花费了十年韶光,试图破解一种细菌的蛋白质构造。
而AlphaFold在“半小时”内就给出了它的预测。

“它(AlphaFold)将改变研究、改变医学、改变统统,” 卢帕斯说。

DeepMind在官网流传宣传,像AlphaFold这样能够准确预测蛋白质构造的系统,可以加速许多有重大社会意义的研究,例如,由于不理解蛋白质的构造,研究职员无法进一步理解嗜睡病、利什曼病等热带医学疾病,而这些疾病每年造成了成千上万人的去世亡。
此外,DeepMind称,这类系统对付许多根本性的研究也有促进浸染:以往开拓一种新型药物,可能须要花费超过25亿美元和十年以上的韶光,而这类AI系统通过破解和疾病有关的蛋白质构造,有助于研究职员创造新型、有效的药物。

综合:南都潘颖欣 冯群星 演习生左影娜 张弛