目前,处于第三波浪潮的AI正在迎来加速发展,AI技能不断打破,进入运用规模爆发的临界点。
2020年,AI还跻身“新基建”七大领域,成为各行各业数字化、智能化升级的主要根本举动步伐,大量布局AI的科技巨子和创业公司逐渐开始涌上潮头。

智能语音榜单TOP20:科大年夜讯飞、百度等居首始创企业过半_智能_语音 绘影字幕

在AI掀起的第四次工业革命中,谁能脱颖而出?继芯片系列榜单后,搜狐科技《中国创新公司100》正式推出AI领域榜单,首期聚焦智能语音领域及代表公司。
未来的一段韶光内,我们还将环绕打算机视觉、机器人等细分领域进行系列策划宣布,并举办主题沙龙活动,敬请期待。

出品 | 搜狐科技

作者 | 梁昌均

编辑 | 杨锦

6月17日,搜狐科技《中国创新公司100》正式发布中国智能语音企业榜单。
根据技能水平、经营状况、融资进展等核心指标,并结合业内专家审定,评比出海内智能语音行业20家代表企业。
海内智能语音行业市场格局如何,这些上榜企业在技能布局和运用落地方面有何进展?榜单深度解读揭晓答案。

要点提炼:

1、环球智能语音市场呈现明显集中趋势,海内市场相对分散,且由本土企业主导;

2、榜单中初创企业达到14家,合计表露融资额近120亿元,头部企业获成本追捧;

3、技能领悟发展是行业趋势,机器学习/深度学习、知识图谱、AI芯片等是榜单企业在智能语音之外普遍布局的技能;

4、智能语音运用在消费级市场以语音助手为代表,企业级市场以智能客服为代表,电信、金融、电商、教诲、医疗、汽车是竞争相对激烈的领域。

本文共计5000余字,阅读大约须要10分钟。

海内市场本土企业“唱主角”

措辞是人与外界沟通最主要的纽带,被称为人工智能皇冠上的明珠。
智能语音的核心是处理自然措辞,即以口头措辞(语音)和书面措辞(笔墨)为研究工具,对其进行识别、理解及天生,从而使机器具备能听会说、能理解会思考的能力。

智能语音涉及多类型学科,紧张包括声学旗子暗记(如声源定位、语音增强、反应抵消等)、模式识别(如声纹识别、语音识别、语种识别等)、自然措辞处理(自然措辞理解、自然措辞天生等),以及语音合成等细分技能,席卷感知智能和认知智能两大层面,个中语音识别和自然措辞处理位居人工智能七大关键技能,也是人机语音交互变革的核心支撑性技能。

智能语音紧张技能方向 资料来源:华西证券

人类对智能语音的探索始于上世纪50年代,迄今已逾70年。
语音识别是最早进行研究的技能,2016年语音识别准确率在深度神经网络的帮助下达到95%,被视为首次基本达到人类水平,智能语音也加速进入技能迭代、产品升级、商业化落地的爆发期。

人工智能之父艾伦·图灵提出的“图灵测试” 一样平常被认为是自然措辞处理思想的开端。
自然措辞处理,是指用打算机对自然措辞(如汉语、英语)的形、音、义等信息进行处理,即对字、词、句、篇章的输入、输出、识别、剖析、理解、天生等的操作和加工,马斯克等联合创建的OpenAI发布超大的自然措辞处理模型GPT-3是该领域的代表成果。

目前,环球智能语音语义市场已相对集中,龙头霸占紧张份额。
据中商家当研究院、广证恒生等机构数据,在环球智能语音语义市场中,Nuance、谷歌、苹果、微软、科大讯飞等头部企业霸占80%以上市场份额。
不久前,微软斥资160亿美元(约 1022亿元公民币)收购 Nuance的交易已获美国反垄断批准,完成后市场规模将进一步集中。

据Frost & Sullivan预测,去年我国智能语音行业市场规模约为254亿元,估量2024年将达到490亿元。
但相对环球,我国智能语音语义市场格局比较分散。
IDC在去年12月发布的《中国人工智能软件及运用(2020上半年)跟踪》报告显示,在智能语音语义运用市场,科大讯飞、百度、阿里市场份额靠前,思必驰、智臻智能等明星创企也霸占一定市场份额。
但前述企业合计霸占份额仅有40%旁边,市场竞争仍比较激烈。

我国智能语音行业市场规模增长情形(亿元) 资料来源:Frost & Sullivan

同时,受限于中英文语义理解差异(叠加方言影响),以及中文语音语料资源匮乏等成分,外洋智能语音巨子,比如Nuance、微软、苹果等市场规模较小,本土企业霸占主导地位。
IDC估量,随着运用处景在AI家当规模化中的主要性不断提升,未来BATH类公司将霸占更高市场份额。

TOP20中14家为初创企业

从这次上榜的20家智能语音企业来看,海内智能语音企业紧张分为三类:以百度、阿里为代表的互联网科技巨子;以科大讯飞为代表的技能做事商;以思必驰、云知声等为代表的深耕于垂直领域和细分场景的初创企业,这类企业最多,达到14家。

据艾媒咨询统计,截止2019年底,我国人工智能创业项目中处于语音识别和语义剖析赛道的企业超过250家,占比达10%,但个中仅有30多企业已完成B轮后融资,也便是说有87%的企业尚处于发展前期。
这次上榜的14家初创企业,均完成B+轮后融资。

榜单的14家初创企业融资情形 资料来源:天眼查

详细来看,有8家企业处于D轮后融资,包括思必驰、云知声、出门问问、智臻智能、捷通华声、中译语通、乐言科技、普强信息;个中思必驰在去年8元完成Pre-IPO融资,云知声去年11月冲刺科创板,但今年2月主动撤回申请,上市终止。
捷通华声、智臻智能都曾是新三板挂牌企业,目前均已摘牌,不用除未来上岸A股的可能性。

从融资额度来看,这14家企业表露的融资金额合计超过117亿元,个中云知声、出门问问、思必驰融资金额最多,分别达到20亿元、17亿元、13亿元,合计占到总额的比重靠近43%,显示成本敌人部企业的追捧明显。
不少企业还得到巨子青睐,如思必驰、智臻智能、乐言科技得到阿里投资,京东持有云知声近4%的股份,捷通华声也得到百度加持。

运用多面着花,巨子抢占智能音箱入口

榜单第一梯队企业中,成立于1999年、脱胎于中科大实验室的科大讯飞,是我国智能语音家当的领头羊,尤其在语音识别领域霸占绝对地位。
2017年科大讯飞作为智能语音行业代表,成为首批国家新一代人工智能开放创新平台。

在技能研发上,科大讯飞强调源头创新、自主研发,目前形成以感知智能+认知智能两大研发方向,在语音合成、语音识别、语音评测、图文识别、医学影像、机器翻译、自然措辞理解等多个核心技能方面均有打破。
近年来,科大讯飞的技能团队规模稳定占比在60%以上,研发投入也持续增长,去年占营收比已靠近17%。

科大讯飞最近五年营收和研发投入情形 资料来源:公司财报

在运用落地上,科大讯飞也逐渐摆脱外界质疑,形成2B+2C双轮驱动、软硬件齐头并进的业务模式,覆盖智能硬件、开放平台、教诲、城市、医疗、汽车、金融、运营商、工业等领域。
2019年科大讯飞营收首破百亿,去年进一步增长至130亿元;净利润近14亿元,同比增长66%。

搜狗也是AI领域的创新者,其在2016年提出了“自然交互+知识打算”的长期核心计策,持续推进语音听写、语音翻译、语音交互等技能研发。
目前,搜狗紧张布局AI硬件和AI交互录音,推出录音笔、腕表等产品,并具备搜狗分身、搜狗同传、搜狗知音等技能和平台。

近年来,搜狗在以语音为主导的人机交互领域,推出了多款“数字人”产品。
从环球AI合成主播,到环球首个3D AI合成主播,再到环球首个手语AI合成主播,是搜狗在语音交互和分身技能上的不断打破。

此外,互联网科技巨子也是智能语音领域不可或缺的角色,这次入榜的阿里、百度和小米便是个中的代表,紧张业务分别表示在天猫精灵、小度和小爱同学上。
天猫精灵是阿里云智能奇迹群于2017年发布的AI智能终端品牌,去年1月升级为独立奇迹部,成为阿里巴趋承构AIoT及内容生态领域的核心平台。

阿里、百度、小米智能语音业务平台情形 资料来源:官网

小度是百度旗下人工智能助手,并开拓了语音操作系统DuerOS。
今年3月,小度智能助手月语音交互总次数达66亿次。
去年9月尾,百度将小度拆分独立融资,百度成本及CPE计策领投,IDG成本跟投,融资后估值200亿元。

小爱同学是小米旗下的人工智能语音交互引擎,搭载在小米手机、小米AI音箱、小米电视等浩瀚小米生态链设备中,月生动用户打破7000万(截止去年3月)。
去年11月,小爱同学5.0正式发布,从语音助手升级为智能生活助手。

智能音箱是这三大企业争相布局的焦点,而依赖补贴攻城、低价策略的互联网玩法,海内智能音箱市场格局集中。
据IDC数据,去年中国智能音箱市场销量3676万,坚持三强争霸局势,阿里、百度、小米合计市场份额超95%,个中阿里天猫精灵位居第一(约35%),百度紧随其后(约33%)。
但在带屏智能音箱市场上,百度以超63%的市场份额遥遥领先,阿里和小米合计为36%。

资料来源:IDC

在语音为主导的人机交互发展趋势下,智能音箱实际上已经成为巨子布局智能家居的入口,这也因此智能音箱为代表的智能家居在近些年开始走向大众的缘故原由。
据eMarketer统计,中国智能音箱遍及率仅有10%,比较美国26%的遍及率,仍有广阔很大市场空间,中国市场潜在用户群体高达2.24亿。

IDC估量称,中国智能家居设备市场到2024年出货量将达到5.3亿台,相较2019年将增长155%。
作为智能家居入口的智能音箱,仍大有可为。
但如何通过打通语音交互、物联网、感应等技能,真正把握用户需求痛点,仍是不小寻衅。

主流语音识别准确率达97%,智能助手和客服运用广泛

从发展程度上来看,语音识别是最为成熟、最先得到大规模运用的的AI技能。
中国语音识别技能发展水平已与国外同步,如百度、科大讯飞、搜狗等主流平台识别准确率目前均达到97%以上。
阿里巴巴的语音技能还超越谷歌,被MIT评比为2019年环球十大打破性技能。

自然措辞处理则在2016年进入期望膨胀期,但由于进展未实现预期,自2019年后转入幻灭期,预期成熟韶光仍有5-10年,其范例运用如数据解读、文本天生等,目前仍处于初步采取阶段。
在这个领域,中国与美国则存在一定差距。

从这次榜单上的企业来看,语音识别和自然措辞处理险些是所有企业都有布局的技能。
但语音识别等相对随意马虎的单点技能的打破,已经难以支撑企业在竞争的红海中取胜。
位居头部的5家企业除了语音识别、自然措辞处理,还布局了其它多个AI技能,并致力于领悟发展,多模态交互被业内认为是未来趋势。

其余14家初创企业还热衷于布局机器学习/深度学习(算法)、知识图谱(大规模语义网络)等技能,包括思必驰、出门问问、智臻智能、中译语通、竹间智能、追一科技、乐言科技、智齿科技、达不雅观数据等。
通过布局这些技能,可以进一步推动语音识别或自然措辞处理的技能打破,如语音识别准确率的不断提升及其运用就离不开深度学习的贡献。

此外,作为算力举动步伐的AI芯片也有多家企业进行投入。
阿里、百度、小米均有在布局,如百度的智能语音芯片“鸿鹄”已在智能家居产品上量产出货;思必驰和云知声也有在研发AI芯片,作为其语音解方案主要的底层硬件举动步伐,成为其发展计策的组成部分。

从总体运用来看,智能语音市场规模进展较快。
清华大学数据显示,语音识别和自然措辞处理是中国市场规模最大的两大AI技能运用方向,占比分别约为25%和21%,合计达到46%,超过打算机视觉市场规模(35%)。

从详细落地来看,消费级市场(2C)和企业级市场(2B)是两大紧张模式。
2C运用紧张包括聪慧生活、智能家居、聪慧办公等场景,通过智能语音技能赋能各种终端,比如手机语音助手,阿里、百度、小米的音箱产品,科大讯飞、搜狗的录音笔产品等。
有数据显示,2018年有近一半智好手机配有智能语音助手,Strategy Analytics估量,到2023年前将达到90%。

智能语音两大运用处景 资料来源:华西证券

相较而言,2B运器具有更高的垂直属性和壁垒,个中智能客服说是最为普遍的运用处景之一。
榜单多数企业均通过供应干系办理方案或打造虚拟的在线机器人,为电信、金融、电商、政务等行业供应咨询接待、问题处理、智能推举等业务。
智臻智能是最早将AI赋能客服领域的企业,其推出的小i机器人深耕智能客服市场十余年,终端客户逾8亿。

捷通华声则是在海内率先推出智能语音助手、电话客服机器人、智能语音外呼机器人、实体智能语音机器人、实时智能语音剖析系统的企业。
乐言科技推出的乐语助人是一款面向天猫、淘宝等平台的新一代AI智能客服机器人,问题识别率达99%,咨询转化率提升15%。
智齿科技则构建了包括呼叫中央、在线机器人和在线客服等产品,贯穿售前+售中+售后全流程,供应覆盖做事+营销+管理全场景的营销与做事办理方案。

教诲、医疗和汽车也是较为普遍的运用领域。
科大讯飞的第一大业务即为教诲,在医疗领域也在持续布局,在车载语音领域拥有半壁江山;思必驰、云知声、出门问问、智臻智能、捷通华声、来也科技、竹间智能、追一科技、普强信息、智齿科技等企业都有布局这三个行业,聪慧教室、电子语音病例、车载语音等是核心运用处景。

总体来看,在智能语音技能不断打破的情形下,运用落地也在持续推进。
但在已有运用处景的情形下,如何提升用户体验,推动交互变革,如何推动企业转型,实现降本增效,挖掘更多的运用处景,并能够规模运用,仍是行业内企业面临的共同寻衅。