人工智能翻译目前多利用基于人工神经网络的模型翻译各种措辞。
这些模型常日须要大量可在线获取的演习数据
不过,有些特定措辞的数据尚不能公开和低本钱获取或普遍可及,这类措辞又被称为“低资源措辞”。

新型人工智能对象可翻译200种措辞_措辞_资本 AI简讯

“元”公司团队新研发的一种跨措辞技能,能让基于人工神经网络的翻译模型学习如何利用已有的翻译高资源措辞的能力来翻译低资源措辞。
团队运用该技能开拓了一个名为NLLB-200的在线多措辞翻译工具,可容纳200种措辞,其能翻译的低资源措辞的数量是高资源措辞数量的3倍。
这一研究成果近期揭橥在英国《自然》杂志上。

由于研究团队在许多低资源措辞上只能获取1000至2000例样本,为扩大NLLB-200的演习数据量,他们利用一个措辞识别系统创造了这些特定措辞的更多实例。
团队还从互联网存档中挖掘这些措辞与英语的双语文本数据,帮助提升模型的翻译质量。

研究者称,该翻译工具可帮助低资源措辞利用者利用互联网等技能,且这一模型还可用于教诲,帮助这类人群获取更多图书和论文资料。
不过研究者也表示,这一工具的误译情形仍有可能涌现。

来源: 央视新闻