探索之路:人工智能成长的回忆与瞻望_人工智能_模子
演讲人:张钹 演讲地点:清华大学“人文清华讲坛” 演讲韶光:2024年4月
张钹 中国科学院院士,清华大学打算机系教授,清华大学人工智能研究院名誉院长。2011年德国汉堡大学付与自然科学名誉博士,获2014年度CCF(中国打算机学会)终生造诣奖,2019年度吴文俊人工智能科学技能奖最高造诣奖。紧张从事人工智能、人工神经网络和机器学习等理论研究,以及模式识别、知识工程和机器人等运用技能研究。在上述领域揭橥学术论文200多篇、专著5部(章)。科研成果获ICL欧洲人工智能奖等奖项。
人工智能的两条路径
迄今为止,全天下对付“什么是智能”尚无统一认识,但经由多年的探索,人工智能已然走出了两条道路。一条道路是行为主义学派,另一条道路是内在主义学派。
个中,行为主义学派主见用机器仿照人类的智能行为。“智能”与“智能的行为”是两个完备不同的观点。“智能”在我们大脑里,人类至今仍对其知之甚少;“智能的行为”则是智能的外部表现,可以进行不雅观察和仿照。因此,行为主义学派人工智能追求的目标是机器行为与人类行为的相似性,而非内部事情事理的同等性。目前人工智能的主流是机器智能,这种人工智能与人类的智能只存在行为相似,并非完备同等。内在主义学派主见必须用机器仿照人类大脑的事情事理,即类脑打算。这两个学派按照不同的思路对人工智能进行探索,前者主见除人类这条道路外,机器或其他方法也可以走出一条智能道路;后者主见走向智能道路只能依赖人类。目前这两种思路都处于探索阶段。
人类对人工智能道路的探索始于1956年。当时在美国召开了人工智能研讨会,来自数学、打算机科学、认知心理学、经济学和哲学平分歧领域的10位专家经由八周的谈论定义了人工智能。他们主见通过符号推理、符号表示来做一个能像人那样思考的机器。在这次会议上,纽维尔(Newell)和西蒙(Simon)演示了一个名为“逻辑学家”的程序。该程序用机器证明了数学事理第二章中的部分事理,数学定理证明与推理相似,这表明机器能做类似推理的事情。终极,“人工智能”在这个会议上得到了定义。
1978年,清华大学成立了人工智能与智能掌握教研组,这是中国最早的人工智能传授教化与科研机构。教研组有三十余位西席参与,个中绝大部分来自立动掌握领域,而非人工智能。1978年,教研组招收了第一批硕士生,1985年开始招收第一批博士生,已能够开展一些与人工智能干系的传授教化事情,但科研事情进展不大。1982年至1984年,教研组进行调查研究,访问了西南、东北等地大量研究所及工厂。结合所见所闻,教研组确定了以智能机器人作为紧张研究方向。
1985年清华大学建立智能机器人实验室,1986年国家设立“863”发展操持,该操持将智能机器人作为一个主题。清华大学参加了第一届智能机器人主题的“863”高技能研究,从第一届到第四届均作为专家单位参加委员会。到了第五届,清华大学成为开展智能机器人研究的组长单位,1997年,成为空间机器人研究的组长单位。“智能技能与系统”国家重点实验室自1987年开始筹建,1990年正式成立。在这些事情的根本上,干系研究得以开展。当时首先建立了两个理论。一是问题求解的商空间理论和粒打算理论,在国际上影响很大。2005年,清华大学发起、组织了国际粒打算会议,每年一次,延续至今。二是在人工神经网络方面做了很多早期事情。
在杭州举办的2023云栖大会上,不雅观众在“人工智能+”展馆参不雅观人工智能产品及运用。新华社发
人工智能的三个阶段
1956年至今,人工智能的发展分为三个阶段,分别是第一代人工智能、第二代人工智能和第三代人工智能。
第一代人工智能的目标是让机器像人类一样思考。思考是指推理、决策、诊断、设计、方案、创作、学习等。无论做管理事情还是技能事情,都须要两方面的能力,一是在某个领域具有丰富的知识和履历,二是具有很强的推理能力。个中推理是指利用知识的能力,换言之,是从已有知识出发,推出新的结论、新的知识的能力。基于以上剖析,人工智能的创始人提出了“基于知识与履历的推理模型”,该模型的核心是若要实现机器思考,只需将相应的知识放入打算机即可。例如,如果要让打算机像年夜夫一样为患者诊断,只须要把年夜夫的知识和履历放到知识库里,将年夜夫看病的推理过程放入推理机制之中,打算机就能为患者履行机器诊断。这一推理模型的核心思想是知识驱动,通过打算模型来实现让机器像人类那样思考。该模型最大的缺陷是缺少自学能力,难以从客不雅观天下学习知识,所有知识都源于人类贯注灌注。因此,第一代人工智能永久无法超越人类。
第二代人工智能源于第一代人工智能的低潮期,紧张基于人工神经网络。1943年,人工神经网络模型提出,它紧张仿照人类脑神经网络的事情事理。第二代人工智能面临的紧张问题是感性知识的传授。第一代人工智能紧张在符号主义辅导下进行,目的是仿照人类的理性行为。但人类除了理性行为外,还有大量的感性行为,而感性行为要用人工神经网络进行仿照。我们常说知识是人类聪慧的源泉,知识是理性行为的根本,这里的知识来自教诲,紧张指理性知识、剖析问题的方法等。但感性的知识难以用措辞传授,也无法从书本上得到。每一个人最初得到的感性知识是对自己母亲的认识。但,详细是什么时候开始对母亲有所认识的?又是若何实现这种认识的?这些问题到现在仍难以解答。所有感性知识都在不断不雅观察、不断谛听的过程中学习累积,第二代人工智能深度学习沿用了这个方法。例如,过去我们紧张通过编程的方法见告打算机马、牛、羊的详细特色,现在则将网上大量马、牛、羊的照片做成演习样本,让打算机进行不雅观察和学习即可。学习完毕,再把剩下的样本作为测试样本去测试它,识别率能达到95%以上。不雅观察和谛听的过程通过人工神经网络进行,将识别的问题作为分类问题,利用人工神经网络来分类。通过神经网络进行学习的过程称为深度学习,基于深度学习能够进行分类、预测和天生等。但是第二代人工智能的所有数据(图像、语音等)均来自客不雅观天下,它的识别只能用于差异不同的物体,并不能真正地认识物体。以是第二代人工智能最大的问题是不屈安、不可信、不可控、不可靠、不易推广。
第三代人工智能的基本思路是必须发展人工智能理论。迄今为止,人工智能尚无较为成型的理论,更多是模型和算法,且第一代和第二代人工智能的模型、算法都有很多毛病。因此,必须大力发展科学完备的人工智能理论,在此根本上,才能发展出安全、可控、可信、可靠和可扩展的人工智能技能。对目前的人工智能技能而言,虽然提高了效率和质量,但系统越信息化和智能化,也就意味着越不屈安。第一代人工智能利用了知识、算法、算力三个要素,个中最紧张的是知识。第二代人工智能则紧张用了数据、算法和算力三个要素。为了战胜人工智能的固有缺点,唯一的办法是把知识、数据、算法和算力这四个要素同时利用。目前得到较多利用的AI工具(大措辞模型),就能够充分利用知识、数据、算法、算力这四个要素。清华大学团队提出了第三代人工智能的三空间模型,将全体感知、认知系统进行连接,为发展人工智能理论供应了非常好的条件。
第四届消博会上,一款“AI数字人”在回答不雅观众提问。新华社发
深度学习的不屈安性
在研究过程中,研究者创造了人工智能深度学习的不屈安性。
个中一个范例案例是:研究者制作了雪山和狗的比拟图,先让打算机和人看雪山,二者都能剖断为雪山,但是只要在图片上添加一点噪声,人看雪山仍是雪山,打算机却会将雪山算作一条狗。这个案例解释,人工智能目前基于深度学习的模式识别跟人类的视觉完备不同,只管它能够像人类那样区分雪山和狗,但实际上它既不认识狗,也不认识雪山。这里面的关键问题是——什么是狗?该当如何定义一条狗?人类常日通过视觉来进行区分,紧张看狗的形状,但什么是狗的形状?狗有各种形态、各种姿势,为什么人类的视觉能够在千变万化的形状里确定目标是狗?这个问题的答案,到现在为止尚未弄清楚。最早的打算机识别狗时,狗变换了位置后打算机就不能识别了,这是位移的不变性,这个问题现在已经办理。但是尚未办理的问题还有很多。例如,打算机能够识别固定尺寸的狗,但是把狗变大或变小后都难以识别,这是大小的不变性。现在打算机只能通过局部纹理来区分狗和雪山。因此,如果将雪山图上的某个纹理改成皮毛纹理,即便雪山的形状保持不变,打算机仍会把雪山误认为是狗。以是说,到目前为止,人工智能的深度学习仍旧不足安全可靠。
中国科学院自动化研究所人形机器人攻关团队科研职员在多模态人工智能系统全国重点实验室调试机器人。新华社发
大措辞模型的“大模型”与“大文本”
目前比较成功的AI工具,其强大性紧张来源于两个“大”,一是大模型,二是大文本。
第一个大模型的“大”是大的人工神经网络,人工神经网络可以用来分类、学习数据中间的关联关系,也可以用来预测。这个巨大的人工神经网络叫“转换器”。AI工具的能力强大,离不开深度神经网络的强大。原来的神经网络是逐字输入,现在一次能够输入2000多字(一个token,粗略地讲相称于一个汉字)。人类从1957年到2013年花了56年韶光探究文本的语意表示问题,现在的文本不是用符号表示,而是用语意向量表示,这也是最主要的一个打破。过去打算机处理文本只能把它当作数据处理,现在可以把它当成知识来处理,即向量表示。此外,还提出了“自监督学习”。过去供打算机学习的文本都要做预处理、预先标注,此项事情量太大,以是无法支撑打算机大量学习。自监督学习是指原来的文本不经由任何处理就可以被打算机学习,用前面的文本预测后面的词,输入后预测下一个,被预测的内容又把再下一个变成输入,有些类似于接龙式学习办法。
第二个“大”是大文本。打算机实现自监督学习后,所有文本不用经由任何预处理就可以学习,文本也由原来的GB量级发展为TB量级。现在比较成功的人工智能大约学习了40TB以上,相称于一千多万本牛津辞典,并且这个学习过程并非去世读,而是理解个中的内容。这就使得我们进入了天生式人工智能时期。无论是第一代还是第二代人工智能,都受到三个限定——特定领域用特定模型完成特界说务。“三个特定”是所谓的“窄人工智能”,即专用人工智能。目前比较成功的AI工具能够通过其强大的措辞天生能力让人类在与它对话时没有领域限定,这是人工智能的重大进步。其余,天生多样性的输出是目前AI工具的主要特色。它有多样化的输出就有可能创新,由于输出多样化,难以担保每个输出都精确,以是越希望它能输出有创造性,就越要许可它犯缺点。我们在日常利用一些AI工具时也会创造,有时AI对问题的回答非常机警聪明,有时则是明显的胡说八道,这便是多样化输出的结果。
目前AI工具产生了两个重大打破,一是天生语意连贯的类似人类的文本,二是在开领域实现了人机自然措辞对话。大措辞模型是向通用人工智能迈出的一步,有西方专家认为这是通用人工智能的曙光,但它并不是通用人工智能,人类走向通用人工智能依然任重道远。
走向通用人工智能必须知足三个条件。第一,系统必须与领域无关。目前较为成功的AI工具在对话、自然措辞处理的问题上做到了与领域无关,但在处理其他大量问题上仍难以实现这一目标。第二,系统与任务无关,即什么任务都会做。目前AI工具能进行对话、四则运算、作诗、写代码等多种任务,但仍难以完成繁芜环境下的繁芜任务。第三,尚需建立一个统一的理论。因此,人工智能还有很长的路要走。
大措辞模型迈向通用人工智能的四个步骤
从大措辞模型迈向通用人工智能须要四个步骤。第一步是跟人类进行交互、与人类对齐,第二步是多模态天生,第三步是与数字天下交互,第四步是与客不雅观天下交互。我们并不是说,完成这四步就意味其实现了通用人工智能,而是说通往通用人工智能这个目标,至少须要迈出以上四步。
第一步是与人类对齐。目前AI工具输出的内容不一定精确,若要办理这个问题,必须依赖人类帮助它战胜,使之与人类对齐。从AI工具的运用实践来看,它的缺点须要人类帮助纠正,而且它的缺点纠正速率和迭代速率都很快。与此同时,我们要看到输出内容的缺点仍旧存在,但我们如果想要它具有创造性,就要许可它犯缺点。
第二步是多模态天生。现在已经可以用大模型天生图像、声音、***、代码等各种模态的内容。随着技能的进步,鉴别一个内容是由机器天生还是人工完成将会变得越来越困难,这为“造假”供应了非常好的机会。“造假”别号“深度造假”,即用深度学习的办法“造假”。试想一下,如果往后网络上95%的文本都由AI天生,那么我们还能通过网络获取真知与原形吗?比方说,当一件事情发生后,网络上涌现一片支持或者反对见地,这些见地究竟是来自多数人的真实表达,还是来自少数人操纵AI歪曲事实?如何有效防止AI工具操纵舆论、稠浊视听,这是须要我们严明考虑的。
目前人工智能领域已经实现了三项打破,即开领域天生语意连贯的类似人类的文本。个中,语意连贯是最主要的打破,这个打破后就有了图像的打破。由于图像只哀求在空间上连贯即可,而***则进一步哀求时空上的连贯。我们在措辞上进行打破,紧接着会有图像的打破,图像打破后肯定还会有***的打破。在这个发展过程中,打算的资源哀求和硬件都会变得越来越多。
随着人工智能的发展,很多人把稳到了“呈现”征象。例如,当系统规模没有达到一定程度时,天生的图画很糟糕、水平较差,但当规模达到一定程度,天生的大多数图画溘然间就变得质量很高。这个过程称为“呈现”,“呈现”是从量变到质变的过程。到目前为止,全天下范围内都还无法完备理解“呈现”征象涌现的缘故原由。
第三步是AI智能体。大措辞模型迈向通用人工智能必须与数字天下进行连接,首先在数字天下里详细操作,从而办理问题、感知自己成果的利害,并进行反馈。这个工为难刁难促进大模型的性能向前发展有很大益处。
第四步是具身智能。具身智能,即具有身体的智能。智能光有脑还不足,还必须具有身体,这样才能动口又动手。以是,大措辞模型迈向通用人工智能,必须通过机器人与客不雅观天下连在一起。
第六届天下声博会上,小朋友们在参不雅观体验一款弈棋机器人(2023年摄)。新华社发
人工智能的家当发展
当下,信息家当的发展非常迅猛,缘故原由在于建立了干系理论,在理论辅导下制作的硬件和软件都是通用的。过去,信息家当领域内涌现了一些具有天下影响力的大型企业,运用推广相应技能并实现信息化,全体链条发展非常迅速。但是,人工智能家当的发展缺少理论,只有算法和模型,而根据算法和模型建立的硬件和软件全是专用的。“专用”即意味着市场很小,到现在为止,人工智能家当还没有产生具有天下影响力的大型企业,以是人工智能家当必须跟垂直领域深度结合才有可能发展。不过,目前情形也在发生变革,具有一定通用性的根本模型的涌现,肯定会影响家当发展。
2020年,全天下人工智能家当达到10亿美元以上的独角兽企业一共有40家,2022年变成117家,2024年初达到126家,从这个情形来看,它是逐步增长的。到现在为止,中国有100乃至200家企业在做大模型。这么多人做根本模型,他们未来的出路在哪里?
第一个出路是向各行各业转移,做各个垂直领域的大模型。现在很多行业都在考虑这个问题,例如石油行业考虑石油行业的大模型,金融行业考虑金融行业的大模型,以是将来做通用大模型的数量将越来越少,大多数做大模型的人才会转向各个垂直领域。第二个出路是最主要的,即经由微调运用在家当里。换言之,供应公开的大模型软件,让大家开拓运用。第三个出路是跟其他技能结合,发展新的家当。国外很多独角兽企业都将AI工具与其他技能结合,发展新家当,有的是向各个行业转移,还有的专门做图像、***、语音等。海内一些大模型现在也已经取得了比较好的发展。
基于此,势必要推动人工智能领域的家当变革。今后无论做硬件还是做软件,一定要放到根本模型的平台当中。过去是在一个零根本的打算机中制作软件,效率很低,而现在平台已经学习超过一千万本牛津辞典,能力水平至少相称于一个高中生,若将同样的事情放到根本模型的平台上进行将会事半功倍,以是采取这个平台是不可阻挡的趋势。而这些“高中生”则来源于大模型企业供应的公开平台。
大模型的局限性
大模型的所有事情都由外部驱动,在外部提示下进行。它缺少主动性,在外部提示下做某事时,紧张基于概率预测的方法,以是会涌现一些人类没有的缺陷,即输出的质量不可控。并且它不知道是非对错,以是它的输出也不可信。与此同时,它受外部影响太大,只能屈服指令来完成相应的事情。但人类则是完备不同的,纵然这件事是由别人安排完成,人也能够在自己的意识掌握下进行,所以是可控、可信的。
由此可见,目前的人工智能并不知道自己的所作所为。AI工具尚不能准确分辨对错,且现在还难以主动进行自我迭代,仍旧须要在人类的操作下进行。未来的人工智能最多成为人类的助手,在人类的监控下进行操作,只有少数事情可以完备交给机器独立完成。有研究机构曾做过关于人工智能对各行各业影响的统计,列出了大量行业,在未来这些行业中只有少数事情可能会被人工智能取代。可见,人工智能对各行各业都有重大影响,但大多数是帮助人类提高事情质量和效率,而非取代人类进行事情。
人工智能是探索“无人区”,其魅力就在于它永久在路上。我们不能由于它的进展而过于乐不雅观,也不必由于它的挫折而沮丧,我们须要的是坚持不懈地努力。
(本讲座文稿由清华大学***与传播学院博士生牛雪莹整理)
《光明日报》(2024年05月25日 10版)
来源: 光明网-《光明日报》
本文系作者个人观点,不代表本站立场,转载请注明出处!