从“等价交流”的远古炼金术开始,化学一贯是一门理解和掌握物质间相互浸染的学科。
人们经由不断解锁和利用新的化学反应,研发出了一系列新材料。
在为人们生活供应便利的同时也提升了能量利用效率,促进可持续发展。
一个基元化学反应由反应物,过渡态(TS),天生物三者构成。
过渡态是化学中至关主要的3D构造,被广泛用于理解化学反应机制、估算反应能垒以及探索弘大的反应网络。
然而,由于其在反应过程中存在的韶光极短(飞秒量级),实验中险些不可能分离和表征过渡态。

AI炼金术改造化学:MIT学者运用生成式AI六秒生成新化学反应_反响物_模子 智能助手

常规情形下,人们利用量子化学的打算方法,通过反复求解薛定谔方程,以确定已知反应物和天生物之间的过渡态。
然而,这种打算方法较为昂贵,并以常常失落败而“臭名远扬”。
同时,该方法受限于个人的履历直觉和打算所需的资源,每个人所能探索的化学反应也是局限的。
这种限定在研究未知的繁芜反应时尤为“致命”。
它会使研究者忽略一些潜在可能发生的反应,导致会反应机理的误判,进而影响催化材料设计的思路。

针对这一问题麻省理工学院(MIT)的一组研究职员开拓出了一种基于机器学习的替代方法,能够在几秒钟内创造这些构造。
他们的新模型可以帮忙化学家探索和设计新的反应和催化剂,从而天生高附加值的有用产品,例如燃料化合物或药物。
此外,该模型还能够仿照自然发生的化学反应,如那些推动早期地球上生命蜕变的关键反应。
“过渡态作为设计催化剂或理解自然系统如何实行某些转化的出发点,知道其详细构造十分主要”MIT化学工程和化学教授Heather Kulik说道。

干系研究事情以“Accurate transition state generation with an object-aware equivariant elementary reaction diffusion model”为题揭橥在Nature Computational Science上,个中麻省理工学院的段辰儒博士是第一加通讯作者 [https://rdcu.be/dtGSF]。
此外,康奈尔大学博士生杜沅岂,麻省理工学院博士生贾皓钧以及麻省理工学院Heather Kulik教授为该论文的共同作者。

1.理论难点

现阶段,化学家可以利用一种基于密度泛函理论的量子化学打算方法来打算过渡态。
然而,这种方法须要大量的打算资源,须要数小时乃至数天才能完成一个过渡态的打算。
为理解决打算韶光久的问题,一些研究职员在近期开始考试测验利用机器学习模型来创造过渡态构造。
然而,迄今为止险些所有开拓的模型都哀求将两个反应物建模为一个整体,而反应物之间相对付彼此则保持特定的几何构型(conformation)。
任何其他可能的构型都会被机器学习模型误认为成一个新的反应。
「如果反应物分子被旋转,那么从事理上讲,在旋转之前和之后它们仍旧可以经历相同的化学反应。
就像我们在评论辩论电解水的时候,只会说水在特定条件下转换为氧气和氢气,而不会描述这些分子的相对几何位置。
但在传统的机器学习方法中,模型将把反应物和天生物在不同几何位置的反应视为两个不同的反应。
这使得机器学习演习变得更加困难,准确性也会随之低落」段辰儒博士表示。

扩散模型作为一个天生式模型曾被运用于图像处理中。
最近,扩散模型还被运用于3D分子和蛋白构造天生、蛋白质-配体对接以及基于构造的药物设计。
在这些运用中,扩散模型利用3D special Euclidean group (SE(3)) 图神经网络(GNNs)来保留分子的排列、平移和旋转对称性。
然而,由反应物、过渡态和产物组成的基元反应却遵照“工具感知“的SE(3)对称性。
这是由于基元反应中三个工具之间的相互浸染不是通过3D欧几里得空间进行的,而是在更高维的电子势能面(potential energy surface)的因果联系。
因此,现有的基于SE(3) GNN的扩散模型会由于毁坏对称性而存在问题。

2.办理方案:

麻省理工学院的团队根据以上问题开拓了一种新的方法,叫做「OA-ReactDiff」。
该团队将SE(3)等变GNN调度为“工具感知”仿照,即在保持单个工具的SE(3)等变性的同时,保持它们在欧几里得空间中独立的相互浸染。
“扩散模型属于天生式人工智能领域,通过随机过程捕捉大略分布与繁芜分布之间的转化。
一旦模型学到了这三种构造如何共存的基本分布,我们可以给它新的反应物和天生物,它将考试测验天生与这些反应物和天生物相对应的过渡态构造”段辰儒博士说。

在演习集中,研究职员利用量子打算方法得到了9,000种不同化学反应的反应物、过渡态和天生物构造。
并在约1,000个之前未见过的反应上进行了测试,哀求它为每个过渡态天生40种可能的构造。
在打算的过程中通过引入“推举模型”来预测哪个过渡态的置信度最高。
在此根本上进一步结合不愿定性估计,研究职员在仅对14% 模型不愿定性最高的反应实行量子化学打算,就实现了2.6 kcal/mol的均匀绝对偏差。
这使得在利用OA-ReactDiff估算300°C的反应速率时,可以得到一个数量级偏差范围内的结果。
OA-ReactDiff天生的构造与量子化学打算得到的过渡态构造比较,均方根偏差 (RMSD) 在0.06埃(千分之六纳米)范围内,这个偏差量级在肉眼种险些不可区分。
更令人欣喜的是OA-ReactDiff天生一个过渡态构造只须要6秒,比较于量子化学打算至少加速了1000倍。
由此,该算法成功实现了对TS构造和反应能垒打算的极高准确性和快速性。

Kulik教授也感慨道「之前我们很难想象在一念之间就能天生数千个过渡态」。

3.未来期许

这项事情是3D扩散模型首次在化学反应中的亮相。
只管研究职员仅对较小数量原子的化合物(<25个原子)的反应上进行了仿照演习,但他们创造全体模型也能够对较大分子的反应进行准确预测。
Kulik教授说:“纵然你面对更大的系统乃至是酶催化的系统,你仍旧可以得到关于原子最有可能重新排列的不同办法”。

研究职员现在操持加入其他组分来扩展他们的模型,比如催化剂。
借助天生式AI的随机性,OA-ReactDiff可以探索到猜想之外的化学反应。
这个特点填补了现有基于化学的直觉反应探索框架,帮助建立更加完全的化学反应网络,助力研发设计新型催化材料。
这方面的研究可以帮助他们加速发掘特定反应的新的催化剂。
此外,他们提出的算法对付开拓药品、燃料或其他有用化合物的新过程可能非常有用,尤其是当合成涉及许多化学步骤时。
「传统上,所有这些打算都是用量子化学进行的,而现在我们能够用更快的天生模型替代量子化学」段辰儒博士说。
研究职员也表示化学反应是化学研究的核心。
除了催化剂设计这种偏“工业型“的可能,OA-ReactDiff还有许多故意思的潜在运用,如探索可能发生在其他行星上的气体间相互浸染,仿照地球早期生命蜕变过程中发生的反应过程等等。

论文信息:

C. Duan, Y. Du, H. Jia, and H. J. Kulik, “Accurate transition state generation with an object-aware equivariant elementary reaction diffusion model”, Nat. Comput. Sci., ASAP, https://www.nature.com/articles/s43588-023-00563-7