DeepMind 研究职员最近揭橥了一篇题为《通过用人工智能勾引人类直觉来推进数学》(Advancing mathematics by guiding human intuition with AI)的论文,认为深度学习能够帮助创造被人类科学家忽略的数学关系。
很快,这篇论文在科技媒体上引起了广泛的关注。

DeepMind 的 AI 能指导人类的直觉吗?_深度_数学 计算机

一些数学家和打算机科学家对 DeepMind 的事情及其论文中所取得的成果表示讴歌,称其具有打破性。
其他人则对此持疑惑态度,认为这篇论文和它在大众媒体上的报导,可能浮夸了深度学习在数学中的运用。

一种基于机器学习的数学创造框架

DeepMind 的科学家在他们的论文中提出,人工智能可以用来“帮忙在数学研究中创造最前沿的定理和猜想”。
他们提出了一种“通过机器学习的强大模式识别和解释方法来增强标准数学家的工具包”的框架。

在数学创造中利用机器学习的框架(由 DeepMind 供应)

数学家们首先对两个数学工具之间的关系做出假设。
为了验证这一假设,他们利用打算机程序为这两种类型的工具天生数据
接下来,一种监督式机器学习模型算法对这些数字进行打算,并考试测验调度其参数,将一种类型的工具映射到另一种类型的工具。

研究职员写道:“在这个回归过程中,机器学习最主要的贡献在于,只要有足够的数据,就可以学习到一系列可能的非线性函数。

如果演习过的模型比随机预测的表现更好,那么它可能表明这两个数学工具之间确实存在着可创造的关系。
通过利用不同的机器学习技能,研究职员能够创造与问题更干系的数据点,改进他们的假设,天生新的数据,并演习新的模型。
通过重复这些步骤,他们可以缩小合理猜想的范围,并加速得到终极办理方案。

DeepMind 的科学家将该框架描述为“直觉的试验台”,它可以快速验证“关于两个量之间关系的直觉是否值得追求”,并为它们可能存在的关系供应指引。

利用这个框架,DeepMind 的研究职员通过利用深度学习得出了“两项基本的新创造,一项是拓扑学,另一项是表示论。

这项事情的一个有趣之处在于,无需弘大的算力,而算力已经成为 DeepMind 研究的支柱。
根据该论文,在这两项创造中利用的深度学习模型可以在“一台只有一个图形处理单元的机器上”在几个小时内进行演习。

纽结与表示

纽结是空间中的一条闭合曲线,可以用各种办法定义。
随着其交叉点数量的增加,它们将会变得更繁芜。
研究职员想看看他们是否可以利用机器学习来创造代数不变量和双曲不变量之间的映射,这是定义纽结的两种根本不同的办法。

研究职员写道:“我们假设,在一个纽结的双曲不变量和代数不变量之间存在一种未被创造的关系。

利用 SnapPy 软件包,研究职员可以天生“署名”、1 个代数不变量和 12 个有希望的双曲不变量,可用于 170 万个纽结,最多有 16 个交叉点。

接下来,他们创建了一个全连接的前馈神经网络,这个网络具有三个隐蔽层,每个隐蔽层有 300 个单元。
他们演习深度学习模型,将双曲不变量的值映射到署名上。
他们的初始模型能够以 78% 的准确率预测署名。
通过进一步的剖析研究,他们在双曲不变量中创造了一个较小的参数集,可以预测署名。
研究职员完善了他们的猜想,天生了新的数据,重新演习了他们的模型,并得出了一个终极的定理。

研究职员将该定理描述为“连接纽结的代数和几何不变量的首批结果之一,它有着很多有趣的运用。

“我们估量,在低维拓扑学中,这种新创造的自然斜率和署名之间的关系将会有许多其他运用。
”研究职员写道:“如此大略而又深刻的关系,在这个早已被广泛研究的领域里却被忽略了,真是太不可思议了。

论文的第二个结果也是对称性的两种不同不雅观点的映射,它的繁芜性远远超过了纽结。

在本例中,他们利用了一种图神经网络(graph neural network,GNN),以求 Bruhat 区间图和 Kazhdan-Lusztig(KL)多项式之间的关系。
图神经网络的一个好处便是能够对弘大的、单凭头脑难以处理的图进行打算和学习。
深度学习将区间图作为输入,考试测验预测相应的 KL 多项式。

同样,通过天生数据,演习深度学习模型,并重新调度过程,科学家们能够得出一个可证明的猜想。

大众对 DeepMind 数学人工智能的反应

谈到 DeepMind 在纽结理论方面的创造,内布拉斯加大学林肯分校的纽结理论家 Mark Brittenham,在接管《自然》(Nature)采访时说:“作者用一种很直接的方法,证明了不变量是干系的,这一事实见告我们,在这一领域中,存在着许多我们尚未充分理解的、非常基本的事物。
”Brittenham 还说,DeepMind 的这项技能在创造惊人的联系上,比起其他将机器学习运用于纽结的努力,它是很新颖的。

以色列特拉维夫大学的数学家 Adam Zsolt Wagner 也接管了《自然》杂志的采访,他说,DeepMind 提出的方法可以证明对某些类型的问题有代价。

Wagner 有将机器学习运用于数学的履历,他称:“如果没有这种工具,数学家可能就会花上好几个星期乃至几个月去证明某个公式或者定理,而这些公式和定理末了都会被证明是缺点的。
”但他也补充说,目前还不清楚它的影响会有多广泛。

持疑惑态度的情由

继 DeepMind 的研究成果在《自然》杂志上揭橥后,纽约大学打算机科学教授 Ernest Davis 揭橥了一篇自己的论文,就 DeepMind 关于结果的框架以及深度学习在普通数学中的运用的局限性提出了一些主要问题。

关于 DeepMind 的论文中提出的第一个结果,Davis 不雅观察到,纽结理论并不是深度学习优于其他机器学习或统计方法的范例问题。

Davis 写道:“深度学习的上风在于像视觉或者文本这样的情景,对付每一个实例(图像或文本)来说,都有许多低级输入特色,难以对高等特色进行可靠的识别,并且对付任何人来说,把输入特色和答案关联的函数都十分繁芜,并且输入特色中没有一个小子集是完备决定性的。

纽结问题只有 12 个输入特色,个中只有三个是干系的。
而输入特色和目标变量之间的数学关系很大略。

Davis 写道:“很难明得为什么有 20 万个参数的神经网络会成为首选的方法;大略、传统的统计方法或支持向量机更适宜。

在第二个项目中,深度学习的浸染更为主要。
“与利用通用深度学习架构的纽结理论项目不同,神经网络被精心设计,以知足对这个问题更深层次的数学知识。
此外,深度学习在预处理数据上比在原始数据上事情得更好,缺点率大约是 1/40。
”他写道。

Davis 称,一方面,这些研究结果与那些批评的不雅观点形成了光鲜的比拟,即把领域知识纳入深度学习中是非常困难的。
他写道:“另一方面,深度学习的爱好者常常夸奖深度学习是一种‘即插即用’的学习方法,它可以用原始数据来办理手头的任何问题;这与这种赞誉相悖。

在这些任务中,要成功运用深度学习,可能在很大程度上依赖于演习数据的天生办法和数学构造的编码办法。
这解释该框架可能适用于一小类数学问题。

“探求天生和编码数据的最佳办法涉及理论、履历、艺术和实验的稠浊。
这统统的重担都落在了人类专家身上,”他写道。
“深度学习可以是一种强大的工具,但也不是万能的。

Davis 提醒道,在当前关于深度学习的炒作氛围中,“存在着一种非常的动机,让人们关注深度学习在这项研究中的浸染,而不但是 DeepMind 的机器学习专家,乃至是数学家。

Davis 总结说,就像在这篇文章中所提到的,深度学习最好被视为“实验数学工具箱中的另一种剖析工具,而非一种全新的数学方法。

值得把稳的是,原始论文的作者也指出了他们的框架的一些局限性,例如“它须要天生工具表示的大型数据集的能力,并且模式在可打算的示例中是可检测的。
此外,在某些领域,在这个范式中可能很难学习到感兴趣的函数。

深度学习与直觉

个中一个争议主题是,该论文流传宣传,深度学习是“勾引直觉”。
Davis 形容这一说法是“非常不准确的描述,即对数学家在利用这样的深度学习时,得到了或者期望得到什么帮助。

直觉是人类和人工智能的主要差异之一。
这是一种比随机预测更好的决策能力,并且在大部分韶光里,它可以勾引你走上精确的方向。
正如迄今为止人工智能的历史所显示的那样,在海量数据中,并没有预定义的规则和模式能够捕捉到直觉。

“在数学的天下中,‘直觉’一词意味着,一个观点或证明可以建立在人们对熟习的领域(如数字、空间、韶光或运动)根深蒂固的觉得上,或者以某种其他办法‘故意义’或‘彷佛精确’,而不须要明确的打算或逐步推理。
”Davis 写道。

Davis 认为,为了得到对数学观点的直不雅观节制,每每须要通过多个详细的例子来进行,但这并非统计学上的干系事情。
换句话说,你不会通过运行数百万个例子和不雅观察某些模式重复涌现的百分最近得到直觉。

这意味着,并不是深度学习模型让科学家直不雅观地理解他们所定义的观点、所证明的定理以及所提出的猜想。

Davis 写道:“深度学习所做的,是给他们供应一些建议,见告他们问题的哪些特色看起来主要,哪些看起来不主要。
这并不值得嗤之以鼻,但也不应该被浮夸。

作者先容:

Ben Dickson,软件工程师,也是 TechTalks 的创始人。
撰写有关技能、商业和政治的文章。

原文链接:

https://bdtechtalks.com/2021/12/13/deepminds-machine-learning-mathematics/