图灵测试,测试机器是否有能力表现出等同于人类的智能行为,测试结果并不取决于机器对问题给出精确答案的能力,而只取决于它的答案与人类给出的答案有多靠近。

为了猜你喜好什么人工智能已经学了70年_措辞_机械翻译 智能助手

由此,维基百科将自然措辞处理(Natural Language Processing,简称NLP)的起源确定为1950年代,不过,实在当时并没有将这作为一个独立的人工智能问题来阐述。

随着科学技能发展,NLP已经属于打算机科学和人工智能的一个主要子领域,这统统的转变是怎么发生的呢?本日我们就一起来看看NLP发展的历史。

NLP历史

象征性自然措辞处理(1950年代-1990年代初期)

在1950年图灵揭橥那篇划时期的论文之后,大家很快就开始了对NLP的研究。

1952年6月的麻省理工学院会议上,美国国防部的邓肯·哈金提出,他的部门将帮助一个机器翻译项目。
由于该会议约请了当时机器翻译领域险些所有的生动研究职员,此发起得到了大家的踊跃支持,末了还额外得到了麻省理工学院电子研究实验室的资金支持。

1954年,乔治城大学和IBM研究所拿着这笔资金,联合开始了著名的乔治城IBM实验:将60多个俄语句子用机器自动翻译成英语。

乔治城大学

实验由一个不懂俄语的打算机操作员将60多个罗马化的俄语声明输入机器,这些声明涉及广泛,包含政治、法律、数学和科学等问题,然后由机器将俄语自动翻译为英文,并通过打印机打印出来;末了精通俄语的措辞学家Paul Garvin将卖力对翻译结果进行验证。

当时实验职员声称在三到五年内,机器翻译将是一个已办理的问题,但是实际的进展要慢得多。

由于这个实验的构想和履行紧张都是为了通过展示机器翻译的可能性,来吸引政府和"大众年夜众的兴趣以及资金,以是它的系统功能并不完善:只有6条语法规则和250个词汇项(词干和词尾)的词汇;要翻译的句子是经由精心挑选的,演示的许多操作都适用于特定的单词和句子;除了一样平常的主题,该系统只在有机化学领域可用;翻译只能在IBM 701大型机进行;句子必须打在卡片上......等等。

IBM 701

1966年,ALPAC报告显示,长达十年的研究未能达到预期目标,之后,机器翻译的资金大大减少了。
直到1980年代后期,第一个统计机器翻译系统被开拓出来之前,中间都很少有人对机器翻译进行进一步的研究。

20世纪70年代,许多程序员开始编写“观点本体(conceptual ontologies)”,将真实天下的信息构造化为打算机可以理解的数据
在这段韶光里,涌现了第一批谈天机器人,比如帕里(PARRY,由当时在斯坦福大学任教的精神病学家Kenneth Colby于1972年撰写。
PARRY试图仿照一个患有偏执型精神分裂症的人。

之后NLP进入了早期发展的壮盛期间。
20世纪80年代和90年代早期,NPL重点领域的研究包括基于规则的解析、形态、语义、参考和其他领域的自然措辞理解,这当中,就包含有二级形态学、HPSG、Lesk算法和定生理论等伟大成果。
由于这一阶段的辉煌成绩,NLP的发展从“象征性自然措辞处理”阶段步入了“统计自然措辞处理”阶段。

统计性自然措辞处理(1990年代-2010年代)

20世纪80年代,大多数自然措辞处理系统都是基于繁芜的手写规则集,直到1980年代后期,NLP发生了一场革命——措辞处理的机器学习算法被引入了。

当时大多数措辞处理系统还和当初的乔治城研究一样,依赖于为这些系统专门开拓的语料库,上文已经提到,这些专用语料库正是系统成功的紧张限定。

IBM研究所借助当时一条哀求“将所有政府程序翻译成相应政府系统正式笔墨”的法律,得到了利用加拿大议会和同盟体例的、多措辞文本文集研发系统的机会,为了用好这个前所未有的超大语料库,IBM研发了从有限的数据中更有效地学习的方法。

IBM研究所

2000年代,随着网络的发展,越来越多的原始(无注释)措辞数据可用。
因此,研究越来越集中在无监督和半监督学习算法上。

此类算法可以从没有手动注释的数据中学习,也可以从已广泛注释和未注释数据的组合中学习。
常日,此任务比有监督的学习困难得多,并且对付给天命量的输入数据常日会产生不太准确的结果。
但是,存在大量的非注释数据可用,如果所用算法具有足够低的韶光繁芜度,则常日可以填补较差的结果。

自然措辞处理(现在)

如今NLP已经渗透到了人们生活中。
一开始的谷歌搜索更像一个索引,我们须要一些技巧才能找到我们要找的东西,但它很快就变得智能起来,可以接管越来越多的自然措辞搜索,根据你输入的第一个字给出的遐想字常日就可以组合成我们要找的词,乃至连智好手机都可以做到这种笔墨自动补全功能。

谷歌搜索

手机或者家具可以对我们说的话做出反应,乃至监控我们的习气喜好,以迎合我们的兴趣、不雅观点等,这些强大科技的核心都是NLP。

而目前,深度学习已经全面运用于许多NLP场景中,在包括人机对话、机器翻译、自动写作、机器阅读等在内的诸多NLP运用中都取得了一系列令人欣喜的进步。

资料来源:

https://en.wikipedia.org/wiki/Natural_language_processing

https://en.wikipedia.org/wiki/Georgetown%E2%80%93IBM_experiment

https://en.wikipedia.org/wiki/Text_corpus

https://en.wikipedia.org/wiki/PARRY

可以说,深度学习已经成为NLP学术研究和运用中不可或缺的一件利器。
以是,本日就给大家推举一本NLP和深度学习的实战好书:《自然措辞处理实战 利用Python理解、剖析和天生文本》

图书推举

自然措辞处理实战 利用Python理解、剖析和天生文本

作者:[美]霍布森•莱恩(Hobson Lane) ,科尔•霍华德(Cole Howard) ,汉纳斯•马克斯•哈普克(Hannes Max Hapke)

译者: 史亮 ,鲁骁 ,唐可欣 ,王斌

内容简介:

本书是先容自然措辞处理(NLP)和深度学习的实战书。
NLP已成为深度学习的核心运用领域,而深度学习是NLP研究和运用中的必要工具。

本书分为3部分:第一部分先容NLP根本,包括分词、TF-IDF向量化以及从词频向量到语义向量的转换;第二部分讲述深度学习,包含神经网络、词向量、卷积神经网络(CNN)、循环神经网络(RNN)、是非期影象(LSTM)网络、序列到序列建模和把稳力机制等基本的深度学习模型和方法;第三部分先容实战方面的内容,包括信息提取、问答系统、人机对话等真实天下系统的模型构建、性能寻衅以及应对方法。

本书面向中高等Python开拓职员,兼具根本理论与编程实战,是当代NLP领域从业者的实用参考书。