吴军:《数学之美》中的人工智能事理仿生和数学人工智能的差异_人工智能_措辞
在《数学之美》中,吴军在第1,、2、3、4、5、30、31章谈到了措辞人工智能和Google大脑及人工神经网络。本日,人工智能已经渗透到了我们生活的方方面面,人工智能极大的方便了我们的生活,那么站在一个非专业认识的角度如何认识人工智能?人工智能的事理究竟是什么?仿生人工智能和数学人工智能又有什么差异呢?
须要声明的是,本文说的仿生是指狭义的逻辑算法的仿生,而不是广义的表象的仿生,如仿生医疗智能设备等不在此范畴。
1、人工智能的事理
人工智能是研究、开拓用于仿照、延伸和扩展人的智能的理论、方法、技能及运用系统的一门新的技能科学。是人或者智能体,通过与环境的交互来提升自身行为和解决问题能力的智能化操作。比如我们的手机语音掌握功能(苹果是Siri,华为的是小艺等),家里的智能灯具、智能窗帘等,还有一些小孩的智能教诲产品也可以实现措辞交互和掌握功能。
人工智能系统包括三个部分。
第一部分是人工智能程序,即能够感知、推理、行动温柔应的程序,这是根本和框架;第二部分是机器学习,把这种智能形式化为数学公式,转换成打算机可以操作的算法和软件。第三部分是深度学习。即机器按照第一步的程序和第二步的算法自我学习各种数据。做好这三步,我们说一个大略的人工智能机器就有了。
大略地讲,人工智能实际上便是研究各种算法,也便是数学、概率论、统计学、各种数学理论与信息网络和工程实践紧密结合的科学。
人工智能经历了仿生人工智能和数字人工智能两个大的阶段。下面我们以自然措辞的人工智能为例来说说什么是仿生人工智能和数字人工智能。
2、仿生人工智能
什么是仿生人工智能呢?我们先来说说机器智能的设想的由来。
最早提出机器智能设想的是打算机科学之父阿兰图灵,1950年他在《思想》(mind)杂志上揭橥了一篇题为"打算的机器和智能"的论文中,提出了一种验证机器是否有智能的方法:让人和机器进行互换,如果人无法判断自己互换的工具是人还是机器的时候,就解释这个机器有了智能。这种方法后来被称为图灵测试(Turning Test)。
在上世纪的1950-1970的这段韶光内,科学家们按照仿生学的思路,要让机器学会翻译或者措辞识别,就必须像人一样,先让打算机学会语法规则,词性和构词法等等,然后将这些规则用算法来描述,想法没有错,在处理大略的措辞和语法是也都能够成功,以是在当时大家对基于规则的自然措辞处理很有信心。
但在实际操作过程中,由于措辞分支多,而且有多音字、多义词等,加之措辞表达习气的多样性,以是当用算法来描述这些规则的时候,所形成的语法剖析树十分的繁芜,而且规则的数量浩瀚,耗时且有时会相互抵牾。而且由于语法规则实在是太多,根本没有办法穷尽。加之当时的打算机处理速率的限定,这种基于语法规则的仿生人工智能局限性越来越大。
举个例子:pen有两个意思,一个意思是钢笔,而另一个意思是围栏。对付两个句子"The pen is in the box."和"The box is in the pen."来说,精确的翻译该当是"钢笔在盒子里"和"盒子在围栏里"。由于正常来说,盒子是不可能在钢笔里的。
3、数字人工智能
直到20世纪70年代后,一些自然措辞的先驱认识到基于数学模型和统计的方法才是精确的道路,以是自然措辞处理进入了第二个阶段——数字人工智能阶段。
1970年往后统计措辞学的涌现使得自然措辞处理重获新生,并且取得了本日的非凡造诣。著名打算机科学家弗里德里克 贾里尼克和他领导的IBM华生实验室,发明了用统计学处理自然措辞的方法——马尔科夫假设,将当时的措辞识别率从70%提升到90%以上,规模从几百单词上升到几万单词。
隐含马尔可夫模型是一个并不繁芜的数学模型,到目前为止,它一贯被认为是办理大多数自然措辞处理问题最为快速、有效的方法。这种办法的核心思想在于统计和概率论,即大多数样本怎么做。假定一个句子里每一个单词涌现的概率,只和它前面的一个单词有关,只要给打算机量足够大的机读文本,打算机就能算出来,在一个特定词后面涌现某个词的概率。我们再把这句话中涌现所有词概率相乘,便是这个句子涌现的概率了。概率最大的句子,便是我们须要的精确句子。
说得直白一点,便是将翻译或识别的措辞按照数学模型算法和机器原来存在的样本库进行比拟,概率最大的便是输出结果。
牛顿说过,"真理在形式上从来都是大略的,而不是繁芜和含混不清的"。人工智能的基石是数学,没有数学根本科学的支持,人工智能很难行稳致远。当我们看完这么繁芜的措辞处理问题便是通过一个大略的数学模型描述和解决时,是不是会情不自禁地感叹数学之美。
-END-
图片来自网络,侵权联删!
本文系作者个人观点,不代表本站立场,转载请注明出处!