人工智能:下一个数据分析的黄金时代_数据_人工智能
反应到市场的人才储备方面,在由环球数据剖析领导企业SAS公司举办的2017中国高校SAS数据剖析大赛上,今年的参赛军队跳升到全国1036支参赛军队近3000多人。而在2013岁首年月次举办该赛事的时候,仅有55支参赛团队约150人参加,2015年达到了295支参赛团队,2016年跃升至658支参赛团队。今年的比赛,全国综合排名前三十名的高校全部报名参赛。
数据剖析的高校学生群体正在快速增长,这也便是意味着未来几年的数据剖析人才将有所增加。但根据Talkingdata和猎聘网的估算,我国到2020年的大数据人才缺口将达200万,核心需求包括数据工程师、数据剖析师和AI工程师/科学家。前不久,美国《哈佛商业评论》揭橥文章指出,人工智能是下一个数据剖析的黄金时期,企业须要进一步建立基于人工智能的数据剖析计策。
把AI集成到数据剖析计策中
自2016年以来,人工智能在市场中的声量和热度已经一浪超过一浪。从AlphaGo到AlphaGo Zero,在商业界和企业界被人工智能的飞速进展所震荡的同时,依然要保持复苏的认识,那便是任何新技能想要落实到企业的实际生产、运营和管理中时,仍旧须要清晰的落地路径、可结合的业务场景以及强有力的领导力。
SAS公司的一份《集成AI到企业剖析计策》的白皮书指出,人工智能和机器学习只管功能强大,但还仅限于特定的任务,可适用的范围也有所局限。人工智能和机器学习所产生的洞察和结论,仍旧须要人类聪慧来决定其用场、在更大的企业计策中发挥浸染,才能真正达成企业的计策目标。
为此,SAS建议企业要把人工智能集成到更大的企业计策中去考虑。在企业履行AI的时候,须要系统性的投资与操持,包括人才。在履行AI运用之前,企业必须要首先建立一个商业策略,明确AI与数据剖析要形成协力,才能真正让AI见效。企业还须要相应建立AI与数据剖析剖析领导力:职员、流程与技能。
SAS白皮书认为,AI不能以黑盒办法运作于企业的数据剖析计策之外,而必须与企业的整体数据剖析结合起来。不同的剖析方法,适用于不同的业务场景。有的场景下,适用基于统计学等的数据剖析;而有的场景,则适宜用人工智能与机器学习的办法处理。
SAS公司作为环球最大的数据剖析供应商,也在发展自己的人工智能与机器学习技能。与其它技能供应商不同的是,SAS在人工智能方面的核心竞争力,是把传统数据剖析和当代机器学习算法集成到一个SAS平台上:也便是一个平台、任何剖析算法。而这对付企业来说,是最空想的选择,这样可以在一个企业级技能平台上,管理所有的算法和剖析。
一个平台、任何算法
成立于1976年的SAS公司,一贯专注于商业数据剖析领域。SAS公司在2016年被超过30份威信剖析机构的报告或评估中被列为领导者,这包括剖析、数据管理、数据整合、数据质量、数字营销、高等和预测剖析、客户洞察、零售剖析、商业智能、敲诈检测、安全办理方案等。根据IDC,SAS占环球高等和预测剖析市场33.3%的份额,比前10名中其它9家干系厂商营收的总合还要多。
对付SAS公司来说,人工智能与机器学习也一贯是其关注的算法方向。在机器学习领域,SAS重点关注深度学习算法;在自然措辞处理领域,SAS重点关注自然措辞理解。个中,深度学习算法可以让机器处理海量的数据,而不断增长的打算力则能让机器处理更大规模的算法模型;加上通过自然措辞与机器进行交互,就可以创造人机之间更强的协同。
有了深度学习和自然措辞理解这,企业就能在业务场景中创建模式识别、预测、分类、图像识别、语音识别、基于认知的搜索、自然措辞交互和自然措辞描述等AI能力。比如自然措辞描述便是用机器剖析大量的文档,然后机器再以自然措辞的办法进行总结,将结果返回给人们;基于认知的搜索,便是通过根据网民的画像,推举同类用户都喜好的商品。把这些AI能力组合,就可以开拓出AI运用。
SAS公司在深度学习方面已经有超过40年的研究历史,而在自然措辞理解方面也有超过30年的研究投入。本日,这些研究成果都已经嵌入到了SAS数据剖析平台产品中,包括SAS 9平台和SAS Viya云做事。通过SAS一个平台跨本地支配和云端,企业可以管理全体剖析的生命周期。
SAS公司大中华区总裁吴辅世强调,SAS公司过去两年投入了10亿美金开拓了新一代的SAS Viya云平台,是云剖析、高性能剖析、人工智能剖析等统一集成开放平台,而无论是SAS 9还是SAS Viya都拥抱和领悟了开源剖析技能,从而成为新一代企业剖析的关键性技能平台。
SAS开源技能白皮书指出,SAS 9和SAS Viya都兼容开源的机器学习措辞Python和R,与Hadoop开源大数据框架结合,能够在稠浊云环境中很好的转换。SAS公司还在数据管理、可扩展性、兼容性、用户交互、可视化剖析、可移植支配、高效运算等方面,对人工智能和机器学习算法进行了商业化和工程化处理。
此外,SAS也支持开源运用和SAS平台之间的相互调用,SAS也在Github掩护了由SAS卖力的开源项目。作为开源项目开放数据平台(Open Data Initiative,ODI)的创始成员、数据管理项目(Data Governance Initiative,DGI)的互助伙伴,SAS公司一贯保持与开源社区的互动。
最佳高等剖析实践
在2017年第三季度的时候,美国数据科学领域的市场调查公司TDWI发布了一份《高等剖析:迈向人工智能、机器学习和自然措辞处理》企业调查报告,指出已经有不少企业率先采取了人工智能、机器学习和自然措辞处理,个中多数是联合利用商用和开源技能,特殊是用开源技能建立模型后再投产到商用工具平台上,而先行者们已经从这些新型高等剖析技能和运用中受益。
TDWI创造,那些成功支配了高等剖析技能的企业,更乐意衡量这些技能所能创造的代价。这是由于,在这些企业中已经形成了数据剖析的良性循环。也便是说,当一个企业向剖析平台中添加更多的数据时,就能产生更好的剖析结果,更好的剖析结果能驱动企业更加成功,而当企业一旦在剖析的根本上实现了更高营收后,就更乐意向新的剖析技能进行投资。TDWI称之为“剖析的成功周期”。
在前期已经见效的AI等新型高等剖析运用中,既有传统的金融敲诈与风险剖析、用户行为剖析等场景,也有预测性掩护场景,还有互动谈天机器人以及嵌入了自然措辞交互的B2B运用,在图片剖析和疾病诊断中也利用了深度学习的方法,其它场景还包括翻译、新药开拓、认知西席、网络安全、智能汽车等等广泛的领域。
TDWI创造,这些成功的早期采取者有两个普遍的最佳实践:在运用AI等新型高等剖析技能之前,必须要清楚地明白和理解企业的目标;其次是IT部门要与业务部门一起互助,才能真正把AI等新型高等剖析技能在企业内落地。TDWI指出,在履行AI等新型高等剖析技能时,要有一个清晰的项目目标,从而让所有项目涉及到的利益方都能够认同项目,还要时候保持对项目目标的关注。
在详细履行AI等新型高等剖析项目时,还有一个成功策略:建立最佳实践中央(CoE)。所谓最佳实践中央,即由跨部门、跨职能、跨组织的高等剖析领导力成员所组的小组,这个小组不仅卖力构建和支配剖析技能与策略,还卖力在企业内部培训以及传播最佳剖析实践。
其它的最佳实践还有得到企业高层的认可、剖析的结果可衡量、在定义项目目标前先做数据实验、组建核心团队构建PoC观点验证、建立内部信赖、对剖析成果不断沟通与传播等。
SAS公司资助了TDWI的本次用户调研。通过调研,TDWI总结了机器学习、自然措辞处理和人工智能等技能的10大最佳实践:理解业务寻衅、尽快从小处起步、理解开源技能的好与不好、雇用数据科学家、建立最佳实践中央、由剖析专家执掌和管理项目、要考虑根本举动步伐(包括云)、把稳数据质量、剖析结果要可实行、理解剖析成功周期。
人工智能将推进数据剖析进入到新的黄金时期,2018年将举办首届SAS数据剖析企业大赛,相信有更多的企业代表将带来在人工智能与数据剖析方面的实战见地与履历分享。
对付正在建立人工智能计策的企业来说,应该认识到人工智能与数据剖析必须结合在一起才能真正为企业创造商业代价。正如Gartner近期指出:首席数据官应立时认识到,为了让人工智能发挥出全部潜力,必须在数据科学领域造就更高的组织能力,并利用数据与剖析得到各种洞察力。
来源:云科技时期
本文系作者个人观点,不代表本站立场,转载请注明出处!