从代码到化学:掌握诺贝尔获奖反应的人工智能系统“Coscientist”_年夜众_人工智能
一个基于人工智能的系统成功地方案和实行了真实天下的化学实验,显示出帮助人类科学家更快地得到更多创造的潜力。
在比你读完这篇文章还短的韶光内,一个人工智能驱动的系统就能自主地理解某些诺贝尔化学奖得主的化学反应,并设计出一个成功的实验室程序来进行这些反应。人工智能在短短几分钟内就完成了所有这些事情,而且一试即中。
卡内基梅隆大学化学家兼化学工程师加布-戈麦斯(Gabe Gomes)说:\"大众这是第一次由非有机警能方案、设计和实行这种由人类发明的繁芜反应。他领导的研究团队组装并测试了基于人工智能的系统。\公众
他们将自己的成果命名为\"大众Coscientist\"大众。Coscientist 所完成的最繁芜的反应在有机化学中被称为钯催化交叉偶联反应,它的人类发明者因此得到了 2010 年诺贝尔化学奖,以表彰这些反应在医药开拓过程和其他利用棘手的碳基分子的行业中发挥的巨大浸染。
Coscientist在《自然》(Nature)杂志上揭橥的论文表明,人类有可能有效地利用人工智能来加快科学创造的速率和数量,并提高实验结果的可复制性和可靠性。这个四人研究小组包括博士生丹尼尔-博伊科(Daniil Boiko)和罗伯特-麦克奈特(Robert MacKnight),他们分别从西北大学美国国家科学基金会化学酶合成中央和圣母大学美国国家科学基金司帐算机赞助合成中央得到了支持和培训。
人工智能化学研究的艺术家观点图。这项事情由卡内基梅隆大学的加布-戈麦斯(Gabe Gomes)领导,并得到了美国国家科学基金会化学创新中央的支持。资料来源:美国国家科学基金会
\"大众除了他们的系统所展示的化学合成任务之外,戈麦斯和他的团队还成功合成了一种超高效的实验室伙伴,\"大众美国国家科学基金会化学部主任大卫-伯科威茨(David Berkowitz)说。\公众他们把所有部件组合在一起,终极的结果远远超出了各部分的总和--它可以用于真正有用的科学目的。\公众
Coscientist 的出身
在 Coscientist 的软件和硅基部件中,最主要的是构成其人工\公众大脑\公众的大型措辞模型。大型措辞模型是一种人工智能,可以从海量数据(包括文档中的书面文本)中提取意义和模式。通过一系列任务,团队测试并比较了多个大型措辞模型,包括 GPT-4 和 OpenAI 公司生产的其他版本的 GPT 大型措辞模型。
Coscientist 还配备了几个不同的软件模块,团队首先对它们进行了单独测试,然后又对它们进行告终合测试。
\"大众我们试图将科学领域所有可能的任务分割成小块,然后逐块构建大图,\"大众设计 Coscientist 总体架构和实验任务的 Boiko 说。\公众末了,我们把所有东西都整合到了一起。\"大众
这些软件模块让 Coscientist 能够做所有研究化学家都会做的事情:搜索有关化合物的公共信息,查找并阅读有关如何掌握机器人实验设备的技能手册,编写打算机代码以进行实验,剖析所得数据以确定哪些有效,哪些无效。
个中一项测试稽核了 Coscientist 准确方案化学程序的能力,这些程序一旦实行,就会产生阿司匹林、对乙酰氨基酚和布洛芬等常用物质。对大型措辞模型进行了单独测试和比较,包括两个版本的 GPT,个中一个软件模块许可它像人类化学家那样利用Google在互联网上搜索信息。然后,根据是否能得到所需的物质、步骤的详细程度以及其他成分,对得出的程序进行检讨和评分。个中,支持搜索的 GPT-4 模块得分最高,它是唯一一个为合成布洛芬创建了可接管质量程序的模块。
Boiko 和 MacKnight 不雅观察到 Coscientist 演示了\"大众化学推理\公众,Boiko 将其描述为利用化学干系信息和以前得到的知识来辅导自己行动的能力。它利用了以简化分子输入行输入系统(SMILES)格式编码的公开化学信息--这是一种表示分子化学构造的机器可读符号--并根据 SMILES 数据中仔细研究的分子的特定部分对实验操持进行了修正。这是化学推理的最佳版本。
进一步的测试包括软件模块,许可 Coscientist 搜索和利用描述掌握机器人实验室设备的运用程序接口的技能文档。这些测试对付确定 Coscientist 能否将其合成化合物的理论操持转化为打算机代码,从而在物理天下中辅导实验室机器人非常主要。
在实验中引入机器人技能
实验室常日利用高科技机器人化学设备,对眇小的液体样品进行吸入、喷出、加热、摇动等操作,并精确地反复进行。这些机器人常日由人类化学家编写打算机代码进行掌握,这些化学家可能在同一个实验室,也可能在国家的另一端。
这是第一次用人工智能编写的打算机代码来掌握这种机器人。
研究小组给 Coscientist 下达了一些大略的任务,哀求它让机器人液体处理机将彩色液体分配到一个包含 96 个小孔的平板上。他们见告它\"大众每隔一条线涂上你选择的一种颜色\"大众、\"大众画一条蓝色对角线\"大众,以及其他让人想起幼儿园的作业。
从\"大众液体处理机 101\"大众毕业后,团队让 Coscientist 打仗了更多类型的机器人设备。他们与翡翠云实验室(Emerald Cloud Lab)互助,该实验室是一个商业举动步伐,里面摆满了各种自动化仪器,包括分光光度计,可以丈量化学样本接管光的波长。然后,向 Coscientist 展示了一个装有三种不同颜色(红、黄、蓝)液体的盘子,哀求他判断盘子里有哪些颜色以及这些颜色在盘子里的位置。
由于 Coscientist 没有眼睛,因此它编写了代码,以机器人的办法将神秘的色板递给分光光度计,并剖析每个孔接管的光波长,从而确定色板上有哪些颜色及其位置。为了完成这项任务,研究职员不得不给 Coscientist 一点精确的提示,让它思考不同颜色是如何接管光芒的。剩下的就交给人工智能了。
Coscientist 的期末考试是将组装好的模块和演习整合在一起,完成团队的指令,\"大众实行铃木和薗头耦合反应\"大众。这两个反应创造于 20 世纪 70 年代,利用金属钯催化有机分子中碳原子之间的键。事实证明,这种反应在生产治疗炎症、哮喘和其他疾病的新型药物方面非常有用。它们还被用于许多智好手机和显示器中有机发光二极管的有机半导体中。2010 年,苏古兹、理查德-海克和根岸英一共同得到诺贝尔奖,正式肯定了这些打破性反应及其广泛影响。
当然,Coscientist 公司之前从未考试测验过这些反应。因此,笔者在撰写前文时,特意去维基百科上查了一下。
麦克奈特说:\"大众对我来说,'尤里卡'时候便是看到它提出了所有精确的问题。\"大众麦克奈特设计了许可 Coscientist 搜索技能文档的软件模块。
Coscientist 紧张在维基百科以及其他许多网站上探求答案,个中包括美国化学学会、英国皇家化学学会的网站,以及其他包含描述铃木和薗头耦合反应的学术论文的网站。
在不到四分钟的韶光里,Coscientist 就利用团队供应的化学物质设计出了产生所需反应的精确程序。当它试图用机器人在物理天下中实行程序时,它编写的掌握液体样品加热和摇动装置的代码涌现了缺点。在没有人类提示的情形下,Coscientist 创造了问题所在,并查阅了设备的技能手册,修正了代码,然后再次考试测验。
结果就涌如今几个眇小的透明液体样本中。博伊科对样本进行了剖析,创造了铃木反应和薗头耦合反应的光谱特色。
当博伊科和麦克奈特见告戈麦斯 Coscientist 的研究成果时,戈麦斯感到难以置信。\公众我以为他们在耍我,\公众他回顾道。\"大众但他们没有。他们绝对没有。就在那时,我溘然意识到,我们这里有一种非常新颖、非常强大的东西。\"大众
有了这种潜在的力量,就须要明智地利用它,并防止滥用。戈麦斯说,理解人工智能的能力和局限是制订知情规则和政策的第一步,这些规则和政策可以有效防止人工智能的有害利用,无论是故意还是无意。他说:\公众我们须要对如何支配这些技能卖力并寻思熟虑。\"大众
戈麦斯是为美国政府确保安全利用人工智能的努力供应专家建媾和辅导的几位研究职员之一,例如拜登政府于2023年10月发布的关于人工智能发展的行政命令。
加速创造,实现科学民主化
自然天下的规模和繁芜程度险些是无限的,个中蕴藏着难以计数的创造,等待着我们去创造。试想一下,新的超导材料可以大幅提高能源效率,新的化合物可以治愈原来无法治愈的疾病,延长人类寿命。然而,得到实现这些打破所需的教诲和培训是一个漫长而艰辛的旅程。成为一名科学家很难。
戈麦斯和他的团队将 Coscientist 这样的人工智能赞助系统视为一种办理方案,它可以弥合尚未开拓的浩瀚自然与演习有素的科学家供不应求这一事实之间的差距,而且可能永久如此。
人类科学家也有人类的需求,比如睡觉和偶尔走出实验室。而由人类辅导的人工智能可以全天候地\"大众思考\"大众,井井有条地翻阅每一块箴言石,检讨并重新检讨实验结果的可复制性。\公众我们可以让一些东西自主运行,试图创造新征象、新反应、新想法,\"大众戈麦斯说。
\"大众你还可以大大降落任何领域的入门门槛,\"大众他说。例如,如果一个没有受过铃木反应演习的生物学家想探索铃木反应的新用场,他们可以请 Coscientist 帮助他们方案实验,这可以实现资源和理解的大规模民主化。
戈麦斯说,科学中存在一个考试测验、失落败、学习和改进的迭代过程,而人工智能可以大大加快这一过程。\公众这本身便是一个巨大的变革\"大众。
编译来源:ScitechDaily
本文系作者个人观点,不代表本站立场,转载请注明出处!