诺奖得主萨金特最新文章:人工智能的来源(全文)_伽利略_达尔文
△《人工智能的来源》
编者按
近日,2011年诺贝尔经济学奖得主托马斯·萨金特(Thomas J. Sargent)教授主编的《萨金特数量经济与金融研究所时讯》(第四期)正式上线,个中《人工智能的来源》一文是首发,分享如下,以飨读者。
作为一个并不全面的见证者,我在本文中描述了人工智能与机器学习是如何被发明的,并列举了该领域的主要人物以及他们的思想。
01简介
这篇文章与人类、人工智能以及学习干系。我所谓的人工是指“非人类”。在描述人工智能和机器学习之前,为了表达我对自然和人工智能的理解,我将首先通过描述有智识的人类通过结合先天与后天技能来完成的两类主要活动,即识别模式和做出选择。智能的其他方面是对韶光和空间的认识,以及对其他人的同情和共鸣。一代又一代的父母把从上一辈传承的技能和不雅观点,以及自己学到的新思想传给孩子。在描述了伽利略 · 伽利雷(Galileo Galilei)和查尔斯 · 达尔文(Charles Darwin) 如何将他们的先天才能与教科书上的知识相结合,继而创造出科学上的打破之后,我将讲述当代研究职员如何设计出能够识别模式和做出选择的打算机程序。 我在这篇文章里提及了许多“树”,即各种观点和技能,这对普通读者来说可能是新事物,但我希望我对机器学习这片“森林”的描述是清楚的。若有读者好奇地想理解更多繁芜的“树”,我建议他们利用专业在线搜索引擎或查看本文结尾处参考文献中的内容。
02人类智能
我从认知心理学家史蒂芬 · 平克(Steven Pinker) 的《白板》(The Blank Slate) 第 13 章的内容开始讲。平克这本书 (2003) 的第 13 章题为《走出我们的深渊》。如果你是 高中生或大一新生,或是喜好思考教诲的目的,推举你阅读这一章。基于对人类认知障碍的理解,史蒂芬 · 平克对在高中和大学该当学习什么内容以及为什么学习供应了建议。他在开章描述了进化使我们自然善于的一些技能,以及我们必须借助学习才能获取的其他技能。在人类 10 万年的历史和史前史中,进化未授予人类的那些技能实在并不主要。但是,当代生活使一些进化未授予我们的东西变得前所未有田主要。平克总结出了四个此类学科 :
物理学:关于重量、韶光、空间、运动、能量、热和光的理论
生物学:关于生命、出生和去世亡的理论
统计学:描述不愿定性以及识别和解释相对频率的方法
经济学:关于事情、生产、分配、价格和数量的描述
在当代生活中,只有理解了这四个领域才能做出明智的个人和公共决策。但我们的“直觉”常常让我们在这些领域中犯错。出于行文目的,暂且将“直觉”定义为我们进化出来的能够快速理解各种情形的思维办法。它的同义词或许是“知识”,即我们本能地就能够理解的东西。
史蒂芬 · 平克描述了我们自然、直觉的理论在这四个领域中是如何将我们引入歧途的,只有通过受教诲才能改进。平克列举了一些四个领域干系的绝佳例子,以解释我们的知识和直觉并不能帮助我们理解当代物理学。根据理查德 · 费曼(Richard Feynman) 和其他精彩的物理学家的说法,“知识”难以帮助我们理解广义相对论和量子力学。平克讲述了我们如何进化出统计打算的能力,这种能力在过去靠佃猎和采集为生时很有帮助,它让我们能够打算一些事宜涌现的几率。但是,比较从前,今日的主要风险事宜发生的几率非常低。而我们的自然禀赋不善于应对小概率事宜。由于在公共决策中无法精确平衡低概率风险事宜的本钱和收益,我们付出过昂贵的代价。
平克描述了进化如何给了我们的先人一套关于生产和交流的经济理论,然而这些理论并没能让我们理解劳动分工、分配、市场、中间商、中介、稳定市场的投契行为和利润。事实上,我们天生就误解了这些东西,在反复发生的针对中间商和贸易商、投契者和流动性供应者的征用和大屠杀中,常常涌现悲惨的后果, 而受害者每每是少数民族成员。这些认知毛病为平克在该书第 13 章呼吁重新设计课程的建议供应了理论根本。平克将教诲描述为一种补偿我们先天的认知限定、利用我们先天学习能力的技能。他呼吁对学术课程进行大刀阔斧的改革,传授那些能帮助我们在当代社会享受生活和做出精确决定的技能:生物学、统计学和经济学。他也承认,多教授这些科目意味着少教授其他科目。
2.1 人工智能和我们天生的认知极限
通过阅读第13 章 , 我们可以理解人类是如何寄希望于“人工智能” 来补充并超越与生俱来的自然人类智能。
这里潜藏着一个悖论 , 即创造人工智能和机器学习的紧张技能工具来 自物理学、生物学、统计学和经济学 , 而这些领域正是我们先天认知有限的。换句话说 , 我们试图在自己天生不善于的领域创造人工智能和机器学习。机器学习和人工智能的早期先驱 和实践者通过透彻地学习以及富有想象力地利用现有的最优化剖析技能 , 来填补他们在自然认知方面的不敷。
03两位机器学习的先驱
3.1 伽利略
由于提倡地球环绕太阳旋转,17世纪初伟大的意大利数学家、科学家、物理学家、天文学家伽利略 (1564-1642) 终极被宗教裁判所逮捕。在被逮捕的许多年前,伽利略从事了一项研究,我认为这项研究演绎了“机器学习”方法的实质。伽利略(1) 设计并进行实验来网络数据;(2) 反复不雅观察数据,试图创造模式;(3) 通过拟合一个函数来减少数据的维度;(4) 将该函数阐明为自然界的一样平常规律。
伽利略的策略为机器学习和人工智能的意义供应了一个绝佳例子, 大概是第一个例子。
自然地 , 我说的是伽利略的“斜口试验”以及他对数据进行的处理和降维。伽利略试图创造掌握落体动力的自然规律。大概你在想“这很随意马虎,只要运用艾萨克 · 牛顿(IsaacNewton) 的万有引力定律就行了”。不要太焦急下定论:牛顿这时候还没有出生呢。
当时被广为接管的主流理论是亚里士多德(Aristotle) 在 2000年前流传宣传的:较重的物体比较轻的物体着落得快。伽利略想用实证方法来研究亚里士多德的理论。为什么不直接扔下不同重量的球 , 以便丈量它们着落的速率呢?伽利略无法这样做 , 由于不论多重的球落下的速率都比当时的钟能准确丈量的速率快得多。
因此 , 伽利略决定建造不同角度的光滑斜面 , 并调度角度 , 使落下的球的速率足够慢 , 这样他就可以用他拥有的时钟丈量它们沿平面的移动速率。对付一个长度1 和高度 h 的平面 , 比率 h_ 决定了平面的角度。伽利略扔下一个球 , 仔细丈量了球沿平面移动的间隔 d, 将 之计作球被扔下后经由的韶光 t 的函 数。他做了一个有两栏的表格 , 个中 记录了 ti 和 di (i = 1,...) ,n 为他在每 个实验中的n个丈量韶光。对付一个给定的实验 , 他将 di 和ti 绘制在一 起。他对各种不同重量的球进行了实验 , 设置了不同的1和h ( 即斜面的不同角度 )。然后他瞩目自己记录的图表,创造一个惊人的征象 : 在所有的图表中 , 行进的间隔与经由的韶光的平方成正比 , 与球的重量和平面的角度无关。他推断出一个公式:
请把稳,出人意料的是,球的重量不在右边的函数中。因此,球的着落速率显然是与它的重量是无关的。因此,通过对他的实验数据进行函数拟合,伽利略同时完成了数据降维和概括。
他创造了一个自然法则,这个法则成为 50 年后艾萨克 · 牛顿思想的一个主要启示。伽利略的斜口试验具有当代机器学习和人工智能的所有要素。他一开始不知道天下是如何运作的,也没有一个好的理论。他所做的完备是无理论的。以是他进行了一系列的实验,网络了数据表,每个实验一个表,以球的重量以及斜面的长度 1 和高度 h 为索引。他从许多数据表中推导 (即“拟合”) 出一个函数,结果创造这个函数只由一个新数字决定,即“参数”。我并不完备理解是什么启示了伽利略去设计他的实验 , 网络那些丈量数据 , 并通过拟合函数来减少丈量数据的维度。
不过我确实知道伽利略拥有的工具 , 以及本可以帮助他、但他却没有的工具。尤其是 , 他不知道微分和积分打算 —— 几十年后 , 这些工具才 被费马(Fermat) 、牛顿和莱布尼茨(Leibniz) 发明出来。但伽利略确实非常理解几何和代数,也十分熟习欧几里得(Euclid) 和阿基米德(Archimedes) 。如果没有这些工具,纯粹的灵感和对亚里士多德理论的疑惑态度是远远不足的。
3.2 达尔文
下一个故事有关经济理论在达尔文(1809 - 1882) 的“自然选择物种进化”学说中所起的浸染。哈耶克 (Hayek)(2011年) 引用了西蒙· N · 巴顿 (Simon N. Patton) 于 1899 年揭橥的一段声明:“ ...... 正如亚当 · 斯密(Adam Smith) 是末了一个道德家和第一个经济学家一样,达尔文是末了一个经济学家和第一位生物学家。”
达尔文利用原始履历主义和降维来构建他的理论。他不知道基因是什么,也不知道 DNA 是什么。他“知道”的是不雅观察他造就的鸽子和自然的动植物所网络来的一个弘大的数据集。仅通过研究鸽子的数据,他就推断出了三个基本原则中的两个:
① 自然变异
② 新变革的统计继续
作为一名鸽子育种者,达尔文利用这两个原则来选择空想的性状,然后依赖统计遗传来造就新的鸽子品种。幼鸽从父母那里得到了一些特色。“查尔斯 · 达尔文的选择”,而不是自然选择辅导其育种。有很长一段韶光,达尔文并不知道在自然中选择的事理是什么。然后,他阅读了托马斯· 马尔萨斯(Thomas Malthus) 的《人口事理对社会未来进步的影响》。
马尔萨斯描写了一场斗争,这种斗争是因人口繁殖速率超过食品产量增速而引发的。在此条件下,食品的可得性制约着人口数量,个体须要为生存斗争。马尔萨斯这方面的论证为达尔文供应了他缺失落的那块拼图:从生存斗争中产生的自然选择。出生的婴儿数量超过了食品所能喂养的数量。达尔文(1859) 的弁言部分将其第三个基本原则归功于马尔萨斯。
③ 竞争选择 ——为了生存的斗争一些精彩的博弈论者和经济学家现在常常利用进化论作为经济和社会动态的来源。
大概这些人认为他们从达尔文那里得到了启示。但实际上达尔文理论的一个主要部分是从经济学家那里得到的。正如哈耶克(2011 年版) 指出的, 达尔文 1838 年对亚当 · 斯密的研究为他供应了生物进化自然选择理论的一个关键组成部分。 哈耶克(2011) 还指出,文化进化论早在 1800 年之前就已被经济学家和社会学家广泛接管。达尔文的研究策略是一个将弘大的数据集降维,以提取基于三个基本原则的低维模型的很好的例子。
数据网络,利用三个基本原则进行数据降维,最后进行理论概括:多么非凡的研究策略!
像伽利略一样,达尔文也不是从零开始。他在生物学、地质学和经济学方面都很博学。对这些领域既有知识的深刻理解是他能够打破已知、进行创新的根本。他是一个“宏不雅观”的人,由于他的理论的前两个支柱,即新特色的变异和继续,并没有“微不雅观根本”。对付在他的三个支柱理论下,须要多永劫光,生物的进化才能够与古生物学与生物学已知的证据相符合,他也说得很模糊。
04人工智能
上文都在评论辩论人类的聪慧和灵感,现在让我们转向人工智能或机器学习。它是什么呢?
我所说的人工智能是指模仿人类完成一些“智能”事情的打算机程序。“机器学习”紧张是通过利用微积分和统计来完成模式识别。参照伽利略利用斜口试验丈量着落物体速率的方法,设计者开拓出能够进行机器学习和人工智能的打算机芯片和程序。因此,将函数视为“如果 - 那么”语句的凑集。将“如果”部分想象为函数y=f(x) 中的横坐标 x,并将“那么”部分想象为 y 纵坐标。利用打算机识别模式涉及:(1) 将数据划分为 x 和 y 部分,(2) 预测 f 的函数形式,然后 (3)利用统计的方法从不同的 x 和 y 数据中推断 f。
“统计学”这门学科供应了用于推断或“拟合”函数 f 的工具。举一个大略的例子。假设在地球上的给定位置,您在一年中的每一天都记录了从日出到日落的“白天”长度,在x轴上按照1到365记录天数,在 y 轴上记录从日出到日落的时长,制作一个以 x 和 y 为两列的表格。该表有 365 乘以 2 即是 730 个数字。现在绘制并瞩目它们。预测函数y=cos(α +βx ) 大概能很好地总结这些数据。利用微积分求使函数拟合得很好的两个参数 α,β 的值,它们最小化了
你会创造这个函数拟合得很好(只管不完美) 。通过总结数据(也可称为进行“数据压缩”或“数据缩减”) ,我们得以找出了一个履历法则(一个函数) 来“概括”我们的创造,并可以利用这个法则来预测 365 天样本以外的 “白天”时长。
05人工智能工具
机器学习和人工智能的核心方法来自以放学科:
1、物理学
2、生物学
3、统计学
4、经济学
接下来我们将逐一剖析这四个学科。
5.1 物理学
欧拉(Euler) 、拉格朗日(Lagrange) 和 汉 密 尔 (Hamilton) 在 18世纪和19 世纪的研究成果扩充和完善了利用微积分最优化时变函数的积分方法。
这为 21 世纪哈密顿蒙特卡罗(Hamiltonian Monte Carlo) 的仿照技能奠定了根本,该技能继而推动了繁芜的贝叶斯估计和机器学习的技能发展。克劳修斯(Clausius) 、玻尔兹曼(Boltzmann) 和吉布斯(Gibbs)在19世纪创造了用统计学来描述热力学的观点。他们根据熵定义了热力学第二定律,熵是似然比的期望值,即一个概率分布与另一个概率分布的比率。个中一个概率分布是一个平坦的均匀分布,它在统计上代表完备无序,另一个分布则在精确的、统计学意义上代表“有序”。在20 世纪末和 21 世纪初,熵为许多机器学习算法供应了一种丈量拟合模型的概率分布与数据履历分布之间差异的方法。保罗 · 萨缪尔森(Paul Samuelson) (1947) 和他的同事们将这些技能和其他技能从数学物理学引入经济学,这将为人工智能和机器学习更多工具的发展奠定根本。
5.2 数学生物学
生物学从韶光和空间上研究物种的繁殖和变异模式。模式可以从“宏不雅观 ”和“微不雅观 ”层面上检测,这取决于研究的单位 —— 个人、动物、DNA、RNA,或组成它们那些更小的分子。生物学的数学理论(例 如,费尔德曼(Feldman, 2014) 和费尔森斯坦(Felsenstein,1989) 通过以随机差分或微分方程的形式构建动态系统来将这些模式构成数学体系。
在微不雅观层面,紧张涉及将 DNA编码为二进制字符串,以便剖析师在该字符串上通过切割和重组进行突变和有性生殖的数学运算。例如,拜会霍兰德(Holland,1987)。
5.3 统计学
当代数理统计认为“概率”有两种可能的含义:
频率论者认为,概率是在不雅观察一个非常大的独立且同分布的随机变量样本后可以预期的相对频率。
贝叶斯阐明,概率是关于未知隐蔽“状态”或“参数”的不愿定性的主不雅观表达。
当代统计学利用一系列工具来:
(1) 制订一个函数集, 这些函数的详细形式取决于一系列参数,有时参数还取决于更高层的超参数;(2) 从样本中 推断或“估算”这些参数;(3) 以一个理性人的角度,描述这些推断的不愿定性;(4) 利用这些拟合函数的概率版本进行“样本外”预测。这些机器学习的基本技能依赖于对微积分的运用,正如我们之条件过,伽利略当时并没有这些工具。
5.4 经济学
经济学是研究人类群体如何有目的地利用和分配稀缺资源的学科。当代经济理论是自洽环境中的多人决策理论。在同等的经济模型中的抽象智能人是“理性的”,由于他们处理有限优化问题皆基于他们对自身所处环境的共同、精确的理解。这种多人决策理论的两个紧张种别是:
博弈论
一样平常均衡理论
这些理论中的紧张成分和内容包括
约束
不愿定性
去中央化和并行优化
交易网络的账本
价格
竞争
在这些模型中,一个个体的决策规则构成了其他个体选择问题的约束集的一部分。这种约束通过模型的“均衡条件”产生。个体约束优化问题的解中,可以导出个人代价,个中包含用以分配资源的有用信息。这些经济模型描述了“并行处理”和去中央化的决策过程。一个被称为“均衡”的安排有助于调和不同个体之间的自私决策以及物理资源的限定。严格的均衡观点在这两个主流框架中霸占主导地位。定义均衡是一件事,打算均衡则是另一回事。
因此,著名的经济理论家们多年来一贯在与维度的谩骂斗争、寻求打算竞争均衡分配和价格体系的可靠方法。对这一奇迹做出了里程碑意义的贡献的经济理论家有艾罗与赫维克兹(Arrow and Hurwicz,1958) 、艾罗(Arrow etal.,1959) 、艾罗(Arrow,1971) 、二阶堂与宇泽(Nikaidˆo and Uzawa,1960)以及斯卡夫(Scarf,1967) 、斯卡夫(Scarf et al.,2008) 。这些算法利用了打算方案,追踪个人和社会代价量,以及人们想要的商品和活动的数量与社会安排之间的差距。打算均衡的研究事情终极创造,均衡的打算与有限理性个体向均衡的收敛之间具有密切联系。
布瑞与克雷普斯(Bray and Kreps, 1987) 以及马赛特与萨金特 (Marcet and Sargent,1989) 提出了“在均衡中学习”和“学习均衡 ”之间的主要差异。马赛特与萨金特 (Marcet and Sargent, 1989) 和萨金特(Sargent et al.,1993) 通过利用随机近似的数学方法(例如,见格拉·迪夫 (Gladyshev,1965) ) 来研究向理性预期均衡的收敛。据我所知,关于随机近似的最初事情始于霍特林(Hotelling,1941)、傅利曼与萨维奇 (Friedman and Savage,1947)。 他们试图构建一种统计抽样方法,来精确地解出一个未知函数在给定点的最大值。
舒比克(Shubik, 2004) 和巴克(Bak et al. ,1999) 的干系事情构建了一些博弈,他们利用这些博弈来思考价格制订者对均衡过程的促进浸染。(在一样平常均衡模型中,只有价格接管者,没有价格制订者) 。舒比克的事情利用了他对一个课题的专业知识,这个课题存在于一样平常均衡理论和博弈论的夹缝中,对机器学习和人工智能有主要意义,它便是:货币理论。
本着舒比克(Shubik 2004) 的精神,思考货币理论的一个好方法是,把稳到它的目的是阐明均衡价格向量是如何被实际生活在一样平常均衡模型中的个体设定的。艾罗和德布鲁(Debreu) 的经典一样平常均衡模型描述了均衡价格向量的特性,但对谁来设定这个价格向量以及如何设定却保持沉默。相反,一个模型之外 的“神灵”神秘地宣告了一个价格向量,同时出清了所有的市场。一个均衡价格向量担保了每个个体的预算约束得到知足。在一样平常均衡模型中,贸易是多边的,预算约束在一个中央化的账户中得到折衷。相反货币理论是关于一个分散的系统,该系统中的人们只是偶尔在一系列双边会面中见面,并通过利用“交流媒介”交流商品和做事。交流媒介可以是耐用金属 (金或银) 、代币(便士、纸质“美元” 或“英镑”) 、流利的债务凭据,或者银行、清算所或中心银行的账目条款。
奥斯特罗伊与斯塔(Ostroy and Starr,1974) ,奥斯特罗伊与斯塔 (Ostroy and Starr,1990) ,以及最近的汤森(Townsend,2020) 总结了该流派的研究。加密货币理论是这些研究的嫡系后代。
我再先容一下博弈研究对机器学习的贡献。几十年来,运用经济学家已经构建了打算博弈均衡的算法,支撑这些打算的关键工具包括逆向归 纳法(动态方案) 和树状搜索。由于要研究的可能状态的维度呈指数增长,减少要研究状态的数量对付在近似均衡方面取得进展至关主要。在这 方面,minimax 算法和 α- β 剪枝搜索算法是紧张的方法,可参考克努斯与摩尔(Knuth and Moore,1975) 的著作和https://www.youtube.com/watch? v=STjW3eH0Cik,可以理解α-β剪枝搜索的描述,并看到相应的打算系统 和“适者生存”的想法。一条干系的研究路线研究了一群天真地基于对手过去的行动进行优化的玩家是否会收敛到纳什均衡。可拜会蒙德勒与沙普利 (Monderer and Shapley1996) ,霍夫鲍尔与桑德霍尔姆(Hofbauer and Sandholm,2002) ,福斯特与杨 (Foster and Young,1998) ,弗得伯格 (Fudenberg et al.,1998) 。当收敛成立时,这种 " 虚构游戏 " 算法供应了一种打算均衡的方法,可拜会兰伯特三世(Lambert Iii et al. ,2005)。
5.5 约翰 ·霍兰德 (John Holland) 在约1985年提出的人工智能愿景
著名的打算机科学家约翰 · 霍兰德是一位先驱者。他结合了我们提到的所有技能领域的思想,为生活在给定环境中的决策者构建了打算机模型。
在这种环境中,决策者别无选择,只能按照艾罗(Arrow,1971)的思路,“在实践中学习”。霍兰德(Holland,1987) 先容了他的这一 方法,马里蒙(Marimon et al.,1990)描述了在多人经济环境中的详细运用。
霍兰德方法的一个主要部分是全局搜索算法,他称之为“遗传算法”。它通过用字符串表示函数的参数来搜索“波折不平的景不雅观”,这些字符串可以被随机匹配成一对字符串,并进行切割和重新组合。这是霍兰德表示“性繁殖”的机器办法。这样的“遗传算法”包含了他所说的“分器 ”系统的一部分。霍兰德的分类器系统更多功能包括:(1) 持续串的“如果 - 那么”语句,个中一些必须相互竞争,以得到在线(即实时的) 决策权。(2) 一种将“如果 - 那么”语句编码为二进制字符串的方法,该字符串可以进行随机突变、切割和重组;(3) 一个为单个“如果 - 那么”语句分配励和本钱的打算系统;(4) 坏和创建新的“如果 - 那么”语句的程序,包括基于 DNA 切割和重组的随机突变和有性繁殖;以及 (5) 一种筛选出适宜决策规则的竞争性斗争。
霍兰德分类器系统已经被证明能够学会在动态环境中保持耐心,就像拉蒙 · 马里蒙(Ramon Marimon) 总结的那样,在由霍兰德的人工智能个体组成的天下中,“耐心须要履历”。霍兰德分类器成功地皮算出了一个动态经济模型的“稳定”纳什均衡,该模型的作者们事先并没故意识到这个均衡的存在,只管事后,他们能够验证霍兰德分类器交给他们的“预测”。可拜会 马里蒙(Marimon et al.,1990) 的先容。
5.6 当今的人工智能
DeepMind 的打算机程序 AlphaGo 实现了一项了不起的造诣,它成功地节制了围棋游戏,并打败了人类围棋冠军选手。可拜会王(Wang et al.,2016) 。AlphaGo 的创造者所采取的方法让我想起了美食的烹饪过程 —— 在一把原估中加入一丁点另一种质料,品尝一下,再加入其他原 料……在烹饪 AlphaGo 的身分中, 包含了从动态方案、汤普森采样(见汤 普森(Thompson,1933) ) 和随机逼近(见霍特林 (Hotelling,1941)、傅利曼与萨维奇(Friedman and Savage(1947)) 、α-β 树搜索(见克努斯与摩尔(Knuth and Moore(1975) ) 、Q- 学习(见沃特金斯和达扬(Watkins and Dayan(1992) ) ;蒙特卡洛树搜索(见 布 朗(Browne et al. (2012) ) 网络到的灵感。参数调度的履历法则选择是很主要的,它可以在“探索”和“利用”之间进行权衡(弗得伯格与克雷普斯(Fudenberg and Kreps,1993) 、(Fudenberg and Kreps(1995) 中也是如此论述的) 。
机器学习的其他最新进展也引入了大量经济学和统计学的方法。打算最优运输问题(例如,佩雷(Peyr´e et al. (2019) ) 利用丹齐格(Dantzig) 、康托罗维奇(Kantorovich) 和柯普曼斯(Koopmans) 的线性程序来衡量理论概率和履历丈量之间的差异。然后,它利用该衡量方法来构建一种高效的打算办法,以匹配数据和理论。 经济学家霍特林(Hotelling,1930) 用黎曼几何来表示统计模型的参数化系列。这个想法开启了打算信息几何学的先河, 阿玛里(Amari,2016) 将这种方法系统化了。
06创造力的来源:模拟和创新
我描述了伽利略和达尔文是如何通过对古人研究结果和方法的节制,并将其与前所未有的洞察力相结合,从而创造新的自然规律的。对先例的尊重,以及他们冒险超越的能力,是这两位天才的成果的突出特点。后来许多天才也采取 了 同样的方 法,如电磁学的发 现,以及富兰克林(Franklin) 、戴维 (Davy) 、法拉第(Faraday) 、麦克斯韦(Maxwell) 、迈克尔逊(Michaelson)、莫利(Morley) 、爱因斯坦(Einstein) 的一系列创造。他们每个人都不是从 “白板”(凑巧的是,这恰好是上述平克著作的标题) 开始,而是从他们对古人的深刻理解和尊重开始的。
每个人都看到了他们的前辈没有看到的东西,每每是由于他们采取了改进的不雅观察或推理方法。通过利用法拉第不知道的数学,麦克斯韦组织了一个令人惊叹的统一和概括,将电磁动力学的 法则减少到 12 个方程,而海维斯德 又很快将它减少到四个方程。这四个方程为爱因斯坦的狭义相对论创造了条件。 看似与电磁学绝不干系的纯理论数学,却与后来电磁学的创造恰好吻合。为了将几何学转换为代数并写成函数, 笛卡尔(Descartes) 发明了一 个坐标系统。50 年后,牛顿和莱布尼茨利用笛卡尔坐标系发明了微分和积分。十九世纪上半叶,高斯(Gauss) 和他的学生黎曼(Riemann) 完善了 基于平行线相交的曲面几何。里奇 (Ricci) 在此根本上增加了一个明确的曲率观点。
爱因斯坦将这两个独立的、看似 “豪不干系”的研究事情结合起来,一个是实际的物理征象,另一个是纯粹 的抽象数学。爱因斯坦在努力扩展其狭义相对论时,学会了如何利用黎曼 几何和里奇曲率,构建了一个自洽的广义相对论。
科学进步展示了“模拟”和“创新”两者之间的互动,这种互动在当代经济增长理论中也有所表示 (例如,见班哈波柏(Benhabib et al.,2014) 和班哈波柏(Benhabib et al.,2020) ) 。 在“模拟 ”阶段,电磁学、相对论和数学领域的先驱者紧张是复制前辈和老师的技能;在“创新” 阶段则是在某种程度上超越前辈和老师,由于他们比老师学得更多、理解得更深。
07结论性评论
通过对物理学、生物学、统计学和经济学中的不雅观点的概述,我希望证明一个主见:即平克 Pinker(2003) 认为我们在认知上有先天局限的学科,正是被用来创造人工智能和机器学习的学科。这正是在学期间和离开学校往后连续学习这些学科的又一个情由。在我看来,它们自身的美则构成了另一个情由。
参考文献如下:
来源:《萨金特数量经济与金融研究所时讯》(第四期)
本文系作者个人观点,不代表本站立场,转载请注明出处!