人工智能7大年夜关键技能终于有人疏解白了_模子_机械

2024-12-08 09:53:32 AI简讯

表1-1 人工智能关键技能

人工智能7大年夜关键技能终于有人疏解白了_模子_机械 AI简讯

本文会更深入地描述这个表中的每种技能及其功能。
我还将论述每种技能在商业AI天下有多普遍。
我的本职事情是商学院的教授（跟很多不同的公司互助过），但我也是德勤计策和剖析实践部门的高等顾问，该部门整合了人工智能方面的咨询事情。

下面是对每一项技能及其功能的深入描述。

作者：托马斯·H. 达文波特（Thomas H. Davenport）

来源：华章科技

01~03 统计机器学习、神经网络和深度学习

机器学习是一种自动将模型与数据匹配，并通过演习模型对数据进行“学习”的技能。
机器学习是AI最常见的形式之一。

在2017年德勤对250位经理（其所在公司都已经在探索AI）开展的“理解认知”调查中，接管调查的公司58%在其业务中采取了机器学习。
它是许多人工智能方法的核心技能并且有很多的版本。
公司内部和外部数据（尤其是这些外部数据）的爆炸式增长使它们采取机器学习来全面理解这些数据变得既可行又必要。

神经网络是机器学习的一种更为繁芜的形式，该技能涌如今20世纪60年代，并用于分类型运用程序，例如确定信贷交易是否为敲诈行为。
它根据输入、输出、变量权重或将输入与输出关联的“特色”来剖析问题。
它类似于神经元处理旗子暗记的办法，但把它比作大脑就有些牵强了。

最繁芜形式的机器学习将涉及深度学习，或通过很多等级的特色和变量来预测结果的神经网络模型。
得益于当前打算机架构更快的处理速率，这类模型有能力应对成千上万个特色。

与早期的统计剖析形式不同，深度学习模型中的每个特色常日对付人类不雅观察者而言意义不大。
这导致的结果便是该模型的利用难度很大或者难以阐明。
在德勤的调查中只有34%的人在利用深度学习技能。

深度学习模型利用一种称为反向传播的技能，通过模型进行预测或对输出进行分类。
AI技能已推动了该领域的许多最新进展，从在围棋大赛中击败人类专家到对互联网图像进行分类，便是利用反向传播的深度学习。
在多伦多大学及谷歌任职的杰弗里·辛顿（Geoffrey Hinton）常日被称为深度学习之父，部分缘故原由就在于他在反向传播方面的早期研究。

机器学习采取了上百种可能的算法，个中大多数算法有些深奥。
它们的范围从梯度增强（一种构建用于办理先前模型缺点的模型的方法，从而增强预测或分类能力）到随机森林（作为决策树模型凑集的模型）。

越来越多的软件工具（包括DataRobot、SAS和谷歌的AutoML）支持机器学习模型的自动构建，这些模型可以考试测验许多不同的算法来找出最成功的算法。
一旦通过演习数据找到了能够进行预测或分类的最佳模型，就可以支配它，并对新的数据进行预测或分类（有时称为评分过程）。

除了所利用的算法外，机器学习的另一个关键是模型如何进行学习。
有监督学习模型（到目前为止是业务中最常用的类型）是利用一组对输出做了标记的演习数据进行学习。

例如，一个试图预测银行敲诈行为的机器学习模型须要在一个明确构成敲诈案例的系统上接管演习。
这并不随意马虎做到，由于实际敲诈的频率可能只有十万分之一（有时称为不平衡分类问题）。

有监督学习与在评分模型中支配的传统剖析方法（如回归剖析）非常相似。
在回归剖析中，目标是创建一个模型，利用一组与输出有关而且其值已知的输入变量来预测一个已知结果。
一旦模型开拓完成，就可以用它通过相同输入变量的已知值来预测一个未知的结果。

例如，根据患者的年事、体育活动水平、热量花费和体重指数，我们可以开拓回归模型来预测他患上糖尿病的可能性。

我们针对已确诊患有糖尿病或没患糖尿病的患者建立模型（常日利用所有可用数据来建立回归模型）。
一旦找到了得当的预测回归模型，就可以利用它基于一组新的数据来预测未知的结果（输入变量达到特定等级时患者患上糖尿病的可能性）。
其后的活动（在回归剖析和机器学习中）称为评分。

回归过程与有监督的机器学习相同，除了：

在机器学习中，用于开拓（演习）模型的数据称为演习数据，而且它可以是明确出于演习目的而保留的数据子集；在机器学习中，常日用另一个数据子集来验证演习模型，该子集的预测结果是已知的；在回归中，可能不须要利用模型来预测未知结果，相反在机器学习中则会对结果做假设；机器学习中可以利用许多不同的算法类型来代替大略的回归剖析。

开拓无监督模型常日更难一些，它要从未做标记的数据中检测模式并预测未知的结果。

强化学习是第三种变体，它是指机器学习系统订定了目标而且迈向目标的每一步都会得到某种形式的褒奖。
它在玩游戏中非常有用，但也须要大量数据（在许多情形下，太多的数据对该方法不起浸染）。

须要指出的是，有监督的机器学习模型常日不会持续学习。
它们从一组演习数据中学习然后连续利用同一个模型，除非利用新的一组演习数据来演习新的模型。

机器学习模型因此统计为根本的，而且该当将其与常规剖析进行比拟以明确其代价增量。
它们每每比基于人类假设和回归剖析的传统“手工”剖析模型更准确，但也更繁芜和难以阐明。
比较于传统的统计剖析，自动化机器学习模型更随意马虎创建，而且能够揭示更多的数据细节。

考虑到学习所需的数据量，深度学习模型在图像和语音识别等任务上非常出色（远远优于以前针对这些任务的自动化方法，并且在某些领域靠近或超过了人类的能力）。

04 自然措辞处理

自20世纪50年代以来，理解人类措辞一贯是人工智能研究者的目标。
这一领域被称为自然措辞处理（Natural Language Processing，NLP），包括诸如语音识别、文本分析、翻译、天生的运用程序及其他与措辞有关的目标。

在“理解认知”的调查中，53%的公司在利用NLP。
NLP有两种基本方法：统计NLP和语意NLP。
统计NLP因此机器学习为根本，而且其性能提升的表现要快于语意NLP。
它须要一个弘大的“语料库”或者措辞体系来学习。

例如，在翻译中它须要大量的翻译文本，而通过统计剖析可以创造西班牙语和葡萄牙语中的amor在统计上与英语中的love一词高度干系。
这虽然有点靠“蛮力”，但常日是相称有效的方法。

语义NLP是近十年来唯一的现实选择，如果能用单词、语法和观点之间的关系有效地对系统进行演习那么它就会相称高效。

措辞的演习和知识工程（常日指为特定领域所创建的知识图谱）可能会花费大量的人力和韶光。
然而，它须要开拓知识主体或者单词与短语之间的关系模型。
虽然创建语义NLP模型难度很大，但现在有些智能座席系统已经在利用该方法。

NLP系统的性能该当用两种方法来衡量。
一种是看它能够理解百分之多少的口语。
随着深度学习技能的发展，该指标不断提高而且每每超过95%。

衡量NLP的另一种方法是看它能回答多少种不同类型的问题或者看它能办理多少种问题。
这常日都须要语义NLP，但是由于这方面并没有重大的技能打破，以是问答系统和问题办理系统都要基于特定的高下文而且必须进行演习。

IBM沃森在回答《危险边缘》的问题时表现出色，但是除非进行演习（常日都因此劳动力密集型的办法），否则它回答不了《命运之轮》（Wheel of Fortune，一档综艺节目）的问题。
大概深度学习在未来会运用于问题解答，但现在它还没有。

05 基于规则的专家系统

在20世纪80年代，AI的主导技能是基于“if-then”规则凑集的专家系统，而且在那个时期开始广泛地运用于商业领域。
如今人们每每认为它没有那么前辈了，但是2017年德勤“理解认知”的调研显示引入AI的美国公司里有49%利用了该技能。

专家系统哀求人类专家和知识工程师在特定知识领域中构建一系列规则。
例如，它们常日用于保险承销和银行信贷承销中（但也用于一些深奥的领域，如福爵咖啡的咖啡烘焙或金宝汤罐头的汤汁调制）。

专家系统在一定程度上运行良好，而且随意马虎理解。
然而，当规则的数量很大（常日超过几百条），并且规则开始相互冲突时，它们每每会崩溃。
而且如果知识领域发生了变革，那么变动规则将会很困难而且也会很耗时。

基于规则的系统自其早期的全盛期间以来并没有太大的改进，但是保险和银行等大量利用它们的行业还是希望能够涌现新一代基于规则的技能。
研究职员和厂商已经开始谈论“自适应规则引擎”，该引擎将基于新的数据或规则引擎与机器学习的组合来不断修正规则，但它们确实还没有得到广泛运用。

06 物理机器人

鉴于环球每年安装的工业机器人超过20万台，物理机器人已经广为人知。
在美国“理解认知”调查中，32%的公司在某种程度上利用了物理机器人。
它们在工厂和仓库等地实行起重、重新定位、焊接或装置产品等任务。
历史上，这些机器人始终在细致的打算机程序掌握下去实行特定的任务。

然而，当下的机器人变得越来越能够跟人类协作，而且更加随意马虎演习，只须要根据预定的任务来移动机器人的部件就可以了。
随着其他AI能力嵌入它们的“大脑”（实际上是它们的操作系统）中，它们也变得更加智能。
随着韶光的推移，我们在AI的其他领域中看到的改进很可能会被融入物理机器人中。

07 机器人流程自动化

机器人流程自动化（Robotic Process Automation，RPA）技能在实行构造化数字任务（即涉及信息系统的任务）时就如同一个人类用户按照一个脚本或者规则在事情。
关于RPA是否属于AI/认知技能的凑集存在着辩论，由于它不是十分智能。
但是由于RPA系统非常盛行、自动化，且越来越智能化，因此我把它也视为AI天下的一份子。

有人把它们称为“数字劳动力”，而且与其他形式的AI比较，它们价格低廉、易于编程，而且行动透明。
如果你会操作鼠标、能理解流程图并能理解一些if-then业务规则，那么你可以理解乃至开拓RPA。
这些系统也比其他方法（例如，用编程措辞开拓自己的程序）更随意马虎配置和履行。

RPA并不真正涉及机器人，它只是做事器上的打算机程序。
它依赖于事情流、业务规则及信息系统集成的“表示层”的结合体，作为系统的半智能用户进行事情。

有些人将RPA与电子表格中的宏进行了比较，但是我认为这不是一个公正的比较，RPA可以实行更为繁芜的任务。
还有人将它与业务流程管理（Business Process Management，BPM）工具进行了比较，后者可能具有一些事情流功能，但常日旨在记录和剖析业务流程，而不是实际将其自动化。

一些RPA系统已经具有一定程度的智能。
它们可以“不雅观察”人类同事的事情（例如回答常见的客户问题），然后模拟他们的行为。
其他一些则把过程自动化与机器视觉相结合。
与物理机器人一样，RPA系统正逐步地变得更加智能化，其他类型的AI技能也被用来辅导它们的行为。

我对这些技能分别进行了描述，但是现实中它们越来越多地被组合和集成。
然而就目前而言，理解什么样的技能可以完成什么样的任务对一个业务决策者来说是非常主要的。

环球公司（Global Inc.）首席信息官克里希纳·内森（Krishna Nathan）指出，他在2018年的一个关键优先事变是“帮助我的利益干系人理解人工智能能做什么和不能做什么，以便我们能以精确的办法利用它”。
大概在将来，这些技能将殽杂在一起，以至于这样的理解将不再必要，乃至不可行。

关于作者：托马斯·H. 达文波特（Thomas H.Davenport），美国巴布森学院（Babson College）信息技能与管理专业精彩教授，获哈佛大学哲学博士学位，并先后授课于哈佛商业学院、芝加哥大学和波士顿大学。
曾任埃森哲计策变革研究院主任，研究领域广泛，包括信息和知识管理、再造工程以及信息技能在商业中的运用。
本文摘编自《数字时期的企业AI上风：IT巨子的商业实践》，经出版方授权发布。
延伸阅读《数字时期的企业AI上风》
推举语：重点解读了IBM、Amazon、脸书和Google等IT巨子企业如何将AI利用到商业运用中。
关注企业如何利用人工智能/认知技能来得到商业利益和竞争上风。