张峥演讲：人脑和人工智能谁又会比谁差？_人工智能_工作

2025-01-11 19:33:03 智能问答

2019年1月15日晚，在知识分子、赛师长西席和中关村落海淀园管委会联合举办的“科学精神中国行”新年专场上，AWS中国人工智能研究院首任院长、上海纽约大学打算机科学教授张峥揭橥了“AI离人脑还有多远”的主题演讲。

张峥演讲：人脑和人工智能谁又会比谁差？_人工智能_工作智能问答

编者按：

1919年1月15日，北大教授陈独秀用“赛师长西席”指称科学。
百年纪念日，北大教授饶毅、谢宇，清华教授白重恩、吴国盛，上海纽约大学教授张峥同台谈论“科技对未来的影响”。
本日我们刊发张峥教授的演讲全文。

演讲 | 张峥（上海纽约大学打算机科学教授）

整理 | 邸利会

我想谈论的一个题目，是看一看人工智能跟人脑的鸿沟在什么地方。

说到人工智能和人的智能之间的关系，大家大概听说过“类脑打算”这个词，但大家可能不清楚它是什么。
听说，领导们在谈论中国脑操持时有问起过，什么叫“类脑打算”，结果都答不上来。
一个将军特殊聪明，他说“类脑打算”便是下一代的人工智能——特殊有聪慧，但实在还是没有回答这个问题。

我在事情中非常喜好跟脑科学家一起互助。
我发觉两个学科之间的鸿沟相称大，常常会发生鸡同鸭讲的问题——我们的措辞不一样、任务不一样、方法论也不一样。
有一个笑话说，一个神经元是生物学的问题，两个神经元便是神经科学的问题，而人工智能一言反面就成千上百万的神经元，从尺度上说就非常不同。

先来看人工智能。
现在AI技能处在井喷状态，给大家举几个我以为很不错的结果。
2017年底，AlphaZero从零开始学习打败了人类围棋、象棋和日本的一个游戏；一年之后，同样的团队调度枪口，做了蛋白质构造的预测；一个多星期前，在《自然·医学》期刊里大概有8篇做数字医疗的文章，好几篇讲人工智能在康健领域的可能运用，这些都是非常有潜力、非常好的结果。

人工智能的做事工具非常广，个中科普最成功的显然便是AlphaGo下围棋这个事，***皆知。
而人工智能也正在进入人们的生活当中，比如智能音箱。
亚马逊花了几年韶光秘密研制，到本日已经成了红海。
我原来住酒店时常常头疼的是一大堆开关，不知道哪个开关管哪个灯。
上次我去一个酒店，一个开关都没有，只有一个音箱，我不知道是Ta哄我还是我哄Ta，花好几分钟我才说服Ta把窗帘关上。
显然是由于我太老了，不习气新东西。

现在人工智能的背后有一个深度学习的方法在起浸染。
我就先大略说一些它是什么。

深度学习到底是什么？

第一个观点大家高中数学都学过：函数。
深度网络实质上便是一个函数，只是这个函数带参数。
深度网络事情时产生一堆数值，是概率。
比如，我们做图形识别，识别一千类物品，网络输出便是一千类的概率分布，是一个一千维的向量。
末了要判断是哪一个，就挑一个最高概率的作为输出。

输入是什么？是特殊高维的向量。
这点大家可能不清楚，输入是来自现实生活、三维天下的一张照片，那怎么可能是几千维的向量呢。
缘故原由在于，如果说一张图片长和宽都有一千个像素，那便是一个一百万个点的矩阵，然后还有红绿蓝三个颜色频道，以是总计是三百万的、很大的向量。
不管我们人是怎么认识这个天下的，打算机的模型看到的便是一个维数很大的向量，假设图片更清晰的话，尺寸就更大。
以是，这个函数，也便是深度网络要做的事情便是把高维向量映射到相对来说低维的向量。

那我们怎么演习这个网络？还是一样，给它图片，它给输出，只是我们要调度参数。
网络一开始肯定是乱的，明明给猫的图片，它输出的种别可能是狗，这个网络就有缺点了，就须要调度参数。

这就引入第二个观点。
大家假如熟习炒股，知道诀窍在于低开高走，深度网络或者机器学习的目标跟炒股是反着的，要高开低走。
高和低，便是缺点程度的衡量，演习模型便是向缺点减少的方向逐步调度，减少缺点。
可以把缺点的曲面直不雅观地想象成一个起起伏伏的山脉。
实际上，非常大的模型的缺点曲面高高低低，非常繁芜。
如果演习数据少，这个曲面就非常不完全，相称粗糙，找不到最低点，或者陷入一个局部最小。
这便是为什么大数据有用，它可以使得表面更平滑一点。

讲到这里，咱们知道了两个观点，第一个是函数，第二个观点便是反炒股。

第三个很关键：演习的标签从哪里来。
一张图片究竟是猫还是狗，不能搞混。
前一段有一个***，在县城里为AI打工的人，这叫数据标注事情者。
比如演习自动驾驶的模型，要把路上的行人框出来，这便是标注。
如果5、6秒标一个，一个小时框三四百个，标框一天两三千个，大概七八十块钱，这个便是现在的所谓人工智能这个新的生态环境开出的新职业。

特殊有趣的一点是，这些标注事情者有个非常朴素的总结，说人工智能实在便是我们教机器怎么来学习，是我们教会了它。

在一定程度上，这没有错。
但打标签是本钱非常高的一件事。
我们学界做的一部分事情便是想把这个本钱降下来，便是说标签不用那么准确，或者少标一点。
如果我们成功了，大概这个新职业又消逝了。

但是有一类人工智能任务实在不须要人工来打标签，比如围棋。

围棋已经有两千多年的韶光，大概二十多年前，宇航员把围棋带到太空里去了，差不多那时候深蓝刚刚胜出人类。
人们普遍认为，下围棋打算机不可能降服人类，由于围棋变革的数目超过了宇宙的原子总数，以是带到外太空去，向外星文明宣示，不要来哦，我们有很高等的文明，比如围棋。

人工智能不才围棋上已经远超人类顶尖棋手。

剩下的事情我想大家都知道，从2014年AlphaGo登场，到2017年完胜，胜负的转变特殊快，人类完败，没有争议——昨天是学生，本日变成老师，昨天是孙子，本日就变成爷爷了，打算机把最好的人类棋手，打得满地找牙。

为什么打算机可以学的那么快？便是由于在这个任务上，标注是零本钱。
打算机下一盘围棋，一眨眼下几千盘。
现在玩游戏，我听说一个机器玩一天算夜概是一个人玩一百还是两百年的量。
如果有一类事情，零本钱，本身又是有构造的，机器可以做得非常好。
当然并不是说这个事情随意马虎，只是说围棋比赛和其他机器学习的任务类似，由于下完之后有输赢，这个输赢就见告我们有偏差，就可以辅导我们调度模型参数。
当然，打算机下围棋里面还是有相称有深度的研究成果，非常聪明的算法，这里暂时略下不提。

到AlphaZero的时候，研究者就不再须要人类棋手的棋谱，打算机自己学，自己下，学完了就把你的牙打得不知道哪儿去了。

人工智能的其它成绩

人工智能还可以做很多其它事。
既然可以分类，就可以辅导下一步棋子落在哪，也可以辅导下一笔画在哪，比如天生字迹。
这一类事情叫做天生模型，2013年的事情已经可以产生几可乱真的字迹，到了2017年，积累了很多人的努力，机器可以天生人脸图片。
这实质上是拿一堆真的人脸的图片，让机器来仿照，然后逐步学出来规律，不只可以自由地天生人脸图片，还可以按照组合哀求合成某一个脸。

大概有人以为AI不能做艺术创作。
看几年前2015年的DeepDream，还做得很差，比如这个模型天生的图片，由于模型的前身是识别物体，看了很多狗狗猫猫，合成一个图片的时候里面就有很多猫狗的影子，看起来挺恶心。

人工智能的艺术创作也已经做到了以假乱真的地步。

同一年的另一类事情：风格迁移，拿一张照片按照某个艺术家的风格迁移过去，就天生了这样的作品。
到了2017年的一个事情，把从16世纪开始的大概25种画派照片网络起来让机器学习。
学习的目标是既要像某一类但是又不能太像，在这样的压力下，模型天生了的图片在网上盲投时过了图灵测试，便是说大家认为这些图片是艺术家画的。
艺术创作的创造性本身到底怎么定义，也变得相称的模糊。

人工智能现在之以是井喷，由于到了一个韶光点能把很多学科揉在一起，比如AlphaGo在围棋背后的所谓强化学习，其观点发轫于一百多年前的生理学。
其成功包括很多学科的支撑，比如脑科学、打算机科学。
个中有很多无形推手，浸染并不直接，比如互联网、数码技能——如果没有互联网、数码相机就没办法网络和标注数据。

还有一个成分是很多商业运用。
有很多看得见摸得着，像自动驾驶、人脸识别、机器翻译等等。
但是我以为更大运用是隐蔽在幕后，比如在车间里、流水线上，也便是说工业4.0。
我自己认为这方面的运用要打开才是好事情，才可以把生产效率提上去。

让机器的脑有构造

讲了那么多还没有讲到关键点：深度模型作为一个函数，哪部分是“脑”，为什么？

在这一点上，我跟不少神经科学家有不合，有的神经科学家以为神经元是最关键，人工智能的神经元该当跟脑一样，须要用脉冲旗子暗记；也有的说优化的方法必须和人脑的学习办法同等。

我以为这些都不是实质，更关键的是函数的形式是什么，或者说网络的高层构造式是什么。

给大家举一些例子，有很多打算机学家做的事情是架构师，便是设计不同网络的构造，底层是神经元，但是可以分身分歧的模块，不同的网络的架构会不一样。
就像人居住的环境，地上打一个草席、到酒店、住高楼，虽然都是睡，但构造不一样，这个构造最关键。
我以为是这个构造本身跟人脑之间的关系要搞清楚。

可如果我们问脑科学家，比如说一句话，哪些脑区是联动的，之间的逻辑和先后次序是什么，打算过程是什么，他们是不是很清楚呢？在上海我主持一个项目，自然措辞处理在脑科学和人工智能之间的联合研究项目。
启动调研的时候，我问，比如说看到桌子上有个苹果，那么说出这句话，人脑是如何做到的，我以为他们（脑科学家）一小时之后就能见告我，结果花了一天给了我一个草案，个中有很多的预测。

我没有任何贬低脑科学的意思，只是说脑科学也在探索，还有很多未知领域，既然有那么多未知，我们怎么和人类智能比较呢？挺困难。
但是我们可以猜，我们可以从其他角度来看这些问题。

比如现在机器翻译相对成熟，但结果还不好，你可以似懂非懂地猜。
那么，我们人类是怎么犯错的呢？我们人类犯的错挺有趣，关键在于人类犯错和机器学习犯的错不一样。
两个别系犯错一样不见得他们背后的事情事理是一样的，但是如果说犯错不一样，那么事理一定不一样。
这可以启示我们怎么设计这个机器。

再比如说诗歌。
我以前非常喜好，现在没有韶光读了，现在有很多写诗的软件，大家大概试过。
但举一些我们出色的墨客写的诗歌，比如里尔克的这首“羚羊”，里面有一句写道：To see you: tensed, as if each leg were a gun loaded with leaps. 这是描写羚羊跳跃的敏捷，他说羚羊的腿像一把枪，装的不是子弹，是跳跃，来形容动作之快，非常形象。

我有一个上海的墨客朋友王小龙，他的这首《爱的十四行》情诗，说“我要在海边盖一座屋子，亲爱的，一座盐粒堆成的屋子，我要的便是通体纯蓝……” “通体纯蓝”这四个字大家琢磨一下，非常有趣：盐会想到提炼，用纯这个字非常对，说海，我们会想象到蓝，这句诗让人以为想象非常自然。
读诗读多了，你会创造意向的跳跃和连接非常有趣，显然我们现在机器学习出来的诗句没有这个能力。

我们反过来看一看，机器学习里面的构造是什么样的。
比如机器学习的翻译模型，便是一串词进去，一串词出去。
大家知道，在图灵测试之后有一个思想实验叫“中国屋”，便是谈论机器到底是不是理解句子。
机器把一个词拿过来，字典翻一翻，找一个词吐出去，叫“中国屋”。
“中国屋”，或者构造是“中国屋”的模型，是不拥有所谓理解的能力的。

我们最少要做到“中国房”。

我曾打趣说，三、四十年前，中国屋和中国房是一回事，由于大家都挺穷。
但是现在“中国房”走进去有各种各样的房间，承载不同的功能，有寝室、厨房、卫生间等等，有层次、有构造。
如果我们的模型是一个扁平的构造，那便是中国屋。
我们最少要做成有层次构造、有功能分块的模型，只有那样，才有希望跟人脑去进行比拟。

在这里，我们也可以从其他地方得到一些启示。
有一个印度小伙子，他做了一件非常了不起的事情。
他创造自闭症的孩子在说话的时候有些词吐不出来，比较抽象的词，比如动词，常常说不出来，以是不成句。
他不雅观察到，自闭症孩子妈妈勾引孩子说话，来理解孩子的意图，是用提问来勾引的：比如说用饭，吃什么？和谁一起吃？什么时候吃？他就做了这么一个游戏，演习自闭症的孩子来产生句子，每个韶光点都是可以正成长的图，这就很像人来成长句子的过程了。
比如“他来我也来”这种带有主从关系的套句，可以有不同的次序来天生。
人说一句话，有各种丰富表达的可能性，这也是措辞的魅力，我们现在人工智能远远没有达到这个地步。

连接两个“智能”的桥梁

我以为连接人脑和人工智能的桥梁是有可能的。
但是要这么看，便是脑科学底层有一些做基因、做神经元、神经电路这些事情，对理解人脑、保护脑非常有浸染，但和人工智能的关系并不直接，也不一定对人工智能有特殊大的启示。
由于底层的可以用神经元做，也可以用其它器件做。
但是，还有一些是更高层的、功能性的、系统层的事情，尤其神经心理学、神经哲学这些新的学科，对人工智能的发展至关主要。

同样的，人工智能也可以分成两种，一种存在于人机交互的界面。
一张图片包含什么信息，一句话在说什么，机器不能瞎猜，机器理解的过程至少跟人脑的认知打算的过程保持同等。

也便是说，在人机交互的这些功能上，比如理解人的措辞、理解人的知识、理解图片、以及各种交互功能，我以为我们没有选择，我们必须要去理解大脑认知打算的过程，用它作为一个辅导来做我们人工智能的东西。
如果这个过程不一样，那么纵然看上去一样，但本色不一样，犯错都不一样，就提不上真正的，能和人紧密打仗的智能来。
这是非常根本也非常主要的事情。

人工智能的其余一部分我索性叫做“累脑”，为什么呢？

由于在人类那么长的进化过程当中，大部分的环境是相对大略的。
大脑还没有足够的韶光和压力来发育出比较成熟的功能来应对一些比较繁芜的任务。
比如概率、统计等等，大家学习的时候会普遍以为比较累，比较“抽象”。
这些问题，实质上是数学问题、搜索问题，就像下围棋，这些问题，人类对付起来天生比较吃力。

对这一类型的人工智能，我以为我们该当放松，不必要拘泥于大脑的构造，我们该当目送AI远去，希望Ta在一马平川上飞奔，做得越来越好。
把我们本来也不善于的任务交给人工智能，让它发力，这样反而可以解放我们人类。

演讲***完全版，可关注知识分子官方微博 @知识分子回看。

关于“科学精神中国行”

“科学精神中国行”是由科技日报和微信公众年夜众号“知识分子”共同发起的大型***活动，携手以高校学子为代表的有识有志青年，让科学走进高校、走向社会，共同磋商科学精神在当今中国的详细实践和意义。

2019年，“科学精神中国行”将走进北京、上海、深圳、长沙等城市，每个城市举行1-2场活动。

这次“科学精神中国行”新年演讲活动由知识分子、赛师长西席与中关村落海淀园管委会联合主理，北京市海淀区公民政府辅导，安翰医疗供应独家资助，今日、公民***、腾讯***、新浪科技、一贯播，科学新媒体同盟供应特约媒体支持，湖南科学技能出版社为这次活动计策互助伙伴。

更多内容：http://www.zhishifenzi.com

本页刊发内容未经书面容许禁止转载及利用

"大众年夜众号、报刊等转载请联系授权

商务互助请联系