4月12日,博鳌论坛AI同传官方互助方、腾讯翻译君卖力人李学朝接管澎湃***(www.thepaper.cn)电话采访对质疑作出回应。
李学朝坦言,AI翻译在目前还须要不断完善,现场语种多元、话题专业性强、噪音滋扰多,肯定会碰着各种问题,首次接管国际会议大考,希望各界对AI翻译有合理的预期。

对话博鳌AI同传负责人:为何明知寻衅这么大年夜腾讯还要坚持_腾讯_博鳌 科技快讯

在本次博鳌部分论坛上,腾讯供应了同传双语内容会议现场投屏、翻译结果语音收听的做事,并许可场外不雅观众在微信小程序查看同传内容。
但腾讯AI同传被创造多个翻译问题,如外国高朋将“一带一起”说反后,AI直接翻译为了“一起一带”;高朋中英文混着讲时,AI同传涌现大面积单词无意义重复、大小写及字符混乱的情形;还有时,AI同传不翻译却连续吐出十几个相同字符。

随后有网络传言称,“腾讯AI博鳌同传还是须要人类,紧急招募人工同传帮忙。

李学朝表示这实属误会。
他阐明道,那天,腾讯***团队为了直播须要,找了人工同传。
腾讯有两个团队做事博鳌,一是卖力现场会议的AI同传团队,一是腾讯***团队。

实际上,各方都预见到之后可能涌现的各类问题。

博鳌论坛现场。

博鳌开幕首日,腾讯董事会主席兼首席实行官马化腾在微信朋友圈中表示,“在博鳌的朋友麻烦现场反馈一下同传效果如何。
新考试测验,多包涵。

“博鳌主理方也知道AI同传的现状在准确度方面肯定达不到百分之百,博鳌会议规格高,翻译难度大,但依然乐意去做这种考试测验,这种对峙异支持的态度传染了我们。
”李学朝说。

李学朝不愿谈及拿下博鳌项目的详细过程,但关于互助用度问题,他透露是免费的。

一些自然措辞处理专家认为,腾讯敢于做这类会议的同传“勇气可嘉”。

“腾讯同传的表现是在猜想之中的。
”爱尔兰都柏林城市大学教授刘群向澎湃***表示,近年来神经网络技能的运用使得机器翻译的水平有了大幅度的提高,但最近一段韶光以来关于机器翻译的宣扬使得大众对机器翻译的期待过高。

刘群说,谷歌和微软的论文都流传宣传机器翻译达到乃至超过了人类翻译的水平,但这样的结论都是在严格的限定条件下才成立的。
一旦跨出给定的领域,或者领域数据不充分,结论肯定是不成立的。

“当然,这次大规模测试也暴露了腾讯同传的一些问题。
”刘群说,同传技能与一样平常的机器翻译不完备一样,它并不仅仅是语音识别和机器翻译的大略组合,而须要有效领悟;语音识别在这种高噪音、高多样性的环境下如果表现不稳定,也会导致后面的机器翻译无法给出合理的译文。

东北大学教授、小牛翻译卖力人朱靖波见告澎湃***,AI翻译从开始基于规则的方法,到上世纪九十年代的统计方法,再到最新的深度学习方法,经历了几个范式,性能得到了巨大提升。
但是由于措辞的多样性和繁芜性,通用的AI同传可能无法在短期达到完美。

李学朝认为,AI同传和人工同传各有上风,两者适用不同的场景。
AI翻译速率快,人工翻译质量高,可以相互互助。

在接管澎湃***近一小时电话采访中,李学朝还被问及腾讯的AI翻译计策、对AI翻译前景的判断、与科大讯飞搜狗的竞争、是否会做最近大热的翻译机、AI翻译的内部赛马机制等问题。

腾讯翻译君卖力人李学朝

以下是澎湃***与腾讯翻译君卖力人李学朝的对话实录:

回应质疑:外界对AI同传的关注度超过预期

澎湃***:最近网上关于博鳌同传AI的非议很多,你对腾讯AI同传这次翻译情形是否满意?

李学朝:腾讯同传能第一次登上国际大会,整体表现还是符合我预期的,有好例子也有坏的例子冒出。
这类跨领域谈论型会议的同传对任何AI系统都有巨大寻衅,参与高朋是多国的,每一种措辞在会上自由谈论、自由切换,口音也各不相同,在一些场景下有可能触发Bug或者不翻译的情形,这也是AI系统可以持续进化的地方。
我们预见到意外情形的发生,但行业对AI同传的关注热度超过我们预期,给了我们多维度的输入,这也是我们这次收成最大的地方。

澎湃***:有传言称,腾讯AI博鳌同传效果不佳,于是紧急招募人工同传帮忙?

李学朝:腾讯同传是百分之百的AI同传,网上传言实属误会。
实际上,腾讯有几个团队做事博鳌,一个是卖力现场会议的AI同传团队,还有一个是卖力直播的腾讯***团队。
发生误会的那天,有一场分论坛的人工同传线路没有直播声音传过来,以是腾讯***团队为了事情须要,找了人工同传。
而那个会场没有腾讯AI同传在支持,不是全部的博鳌论坛都支持腾讯AI同传。

澎湃***:为什么只有几个论坛支持AI同传,而不是所有的论坛?

李学朝:我们为了担保同传速率,都是在现场用做事器直接支配到本地,以是在这种情形下,我们没有准备那么多套做事器能一下子做事全场的会议。

澎湃***:为什么将“一带一起”的英语缺点翻译成了“一起一带”?

李学朝:高朋在会场上发言比较口语化,在英文表达的时候把“一带一起”说反了,说成the road and belt,机器就把它当成字面的意思直译出来了。
这便是人跟机器的差异吧。
如果是人工的话,就有很大的容错,会把它翻译成“一带一起”。

澎湃***:既然是人工智能系统,为什么它没有反应过来是高朋说反了?

李学朝:这是当古人工智能翻译技能现状,它无法结合高下文去校正发言准确性,现在技能上一些学术圈内开始有这方面的研究,但是还没有到产品实用的阶段。
目前,我们已专门针对上面“一带一起”可能的缺点表达个例做了逼迫转化。
不过人类措辞很丰富,我们没有办法穷举所有可能说错的情形。

澎湃***:有张截图显示,AI同传过程中,涌现不翻译情形,反倒天生了很多for。

李学朝:涌现这个情形紧张是包括神经网络机器翻译在内的深度学习算法,在事理上或多或少都有一定不愿定性,在特定的情形下有一定概率引发翻译偏差。
高朋重复说了4个for,刚好这种情形触发了系统把它翻译成更多的for出来,而翻译引擎不巧放大了这个重复,涌现翻译缺点,我们在技能与产品方面会有针对性优化。

澎湃***:像噪音、措辞口音的问题怎么办理呢?

李学朝:之前大家看到的AI同传大多是用在单场个人演讲中,只管那已经很繁芜了,但比较谈论型会议,繁芜度还是低的。
博鳌这类国际谈论会议中,多国高朋同场参与、多种口音、多语自由切换或中英文夹杂,多噪音等特点,繁芜度很高,对AI同传有极大的寻衅。

硬件方面,可以用更多有指向性的设备,比如麦克风阵列;另一方面,也须要提高语音识别技能。
这些问题须要学术圈、企业、科研机构等一起努力来办理的。

中英文混讲导致大面积单词无意义重复、大小写及字符混乱。

澎湃***:据现场反响,高朋如果中英文混着讲的话,AI翻译也会缭乱。

李学朝:中英混讲的情形,确实对系统也很寻衅。
目前我们系统的做法会判断这一句话到底中文多一些还是英文多一些,来决定翻译为哪种目标措辞。
在中英双语切换频繁或一个单句包含的中英文量级差不多时,后台中、英文识别引擎就会同时开始事情,会导致两种识别引擎相互“掐架“,翻译结果只能选择一种措辞进行输出,有可能涌现句子中的中文也被当作英文了,以是这时候就有可能涌现翻译缺点的情形。

幕后故事:免费向博鳌供应AI同传做事

澎湃***:为什么明知道博鳌这个会场的情形会特殊繁芜,但是腾讯还是要坚持做AI同传呢?

李学朝:我们确实预测到难度比较大,由于这种会场规格高,难度又很大,但是博鳌作为主理方,乐意去做这种考试测验,也知道AI同传的现状在准确度方面肯定达不到百分之百,这种对峙异支持的态度传染了我们,也是一个向国际及行业内外展示AI同传当提高展状态的机会,因此我们认为这是一次很好的历练。

澎湃***:参加博鳌之前,预期AI同传准确率大概达到多少,现在看来实际的准确率大概是多少?

李学朝:基本上,语音识别翻译准确率在90%以上,目前看来和我们的预期差不多。
但由于比我们之前支持同传的会议要繁芜,以是末了准确率的数据还须要做进一步统计。

澎湃***:腾讯是怎么接到博鳌同传的项目的?

李学朝:博鳌亚洲论坛从会议主题到会务细节都秉承开放、创新的精神。
每一届都会约请代表科技前沿的产品进行技能展示。
AI同传是一个方向,博鳌选择了腾讯同传。
我们针对博鳌做了非常充分的准备和技能升级,把博鳌往届的***拿过来在系统中进行测试,经由反复验证,末了才把这套系统拿出来。

澎湃***:给博鳌供应项目的价格?

李学朝:这个互助是免费的。

澎湃***:你认为AI同传和人工同传是什么关系?

李学朝:AI同传和人工同传各有上风,两者适用不同的场景,可以协同。
很多会议条件不许可,无法为每个语种请一个同传;一个会议须要多个人工同传轮流支持,非常耗精力,这时候AI同传能做协同。
但AI同传不能百分之百翻译对,也须要与人工同传互助。
人工同传在会议之前往往也须要学习,来补充不同行业的知识。

谈行业:各家重回新的起跑线

澎湃***:在AI翻译方面,前有科大讯飞和百度,为什么腾讯也参与进来了,并加大了投入?

李学朝:紧张两个成分吧,一是翻译的用户场景和需求,二是机器翻译技能变革。
腾讯翻译君是在公司鼓励内部创业的背景下,我们团队孵化的一个项目。
最初是为了帮助出国旅游的用户办理措辞问题,然后看到腾讯许多产品的用户都有外语利用需求,有很好的结合场景。
腾讯翻译君是2016年发布的,在2016年之前的机器翻译技能并没有让用户非常满意,我们不雅观察到神经网络机器翻译技能是一个新的机会,一个技能迁移转变点、并决定走这一新的技能路线。
目前,大家都在用这套新的技能路线,各家又回到了新的起跑线。
实际上,腾讯翻译君全量支配与利用神经网络机器翻译技能,反而是业界最早的一批。

澎湃***:这两年国内外公司都在大力投入AI翻译,你如何判断AI翻译市场的前景?

李学朝:这个市场还是有前景的,技能的演进让AI翻译质量有了较大提升,在一些特定的领域或场景已经可以赞助人类做更多事情,比如在旅游、会议等场景,多家公司也都推出了翻译App,但当前AI翻译技能还在发展中,还没有到完美的阶段。
目前学术圈研究热度与各公司的技能升级迭代速率都保持的不错,相信AI翻译在与现有产品或行业结合的落地场景会有挺多机会与新的考试测验。

比如,腾讯翻译君现在已将AI翻译的能力以做事的办法在腾讯云和AI开放平台开放出来了,包括微信、***、***浏览器、王者光彩外洋版(AOV)、金山词霸、VIPKID、富途等几十个产品或不同行业的客户在利用。
目前,腾讯翻译君这套做事每天要求数量已经超过4亿次了,腾讯同传近期也入围了中国人工智能家当发展同盟组织的《中国人工智能家当发展同盟人工智能技能和运用案例集》。
我们希望腾讯翻译君赋能互助伙伴,也期望与行业一起互助让AI翻译更强大。

澎湃***:科大讯飞和搜狗推出了翻译机硬件产品,腾讯未来会不会做翻译机?

李学朝:我们要看翻译机是否能更好知足一些用户需求或场景。
目前也有一些厂商找我们沟通,在未来,我们不用除这种可能性,目前还没一个确定的结论。

澎湃***:如何理解翻译机这种产品形态?我可以用手机翻译,为什么还要再拿一个翻译机呢?而且翻译机的价格还不低,都要一千元以上,相称于买一个手机的价格了。

李学朝:你说的这一点确实很认同,也是我们在考虑的问题。
现在看这个市场很火,出货量各方面在升温,肯定也是有需求和场景的,我们是抱着一个开放的态度,持续去关注这个事情。

澎湃***:腾讯内部,有几个团队在做AI翻译?

李学朝:腾讯内部有赛马机制,腾讯内部做同传也有几个方案。
腾讯同传是基于腾讯翻译君和微信智聆研发的一套方案。
2017年底,我们公司年会,有两套同传系统同时为年会做事。
公司几个大老板现场演讲,两套同传系统在旁边两边同时输出PK,这个事宜对我们的触动是非常大的。
末了结果出来往后,让我们看到AI翻译在会议同传方面可以做更多的事情,以是我们这两个团队又都做了更多蜕变,然后在更多的会议运用和实践。