AI+医疗全新案例 ERNIE助力阿尔茨海默症早期诊断_停留_阿尔
近日,环球语音研究领域顶级会议INTERSPEECH2020召开,值得一提的是,个中利用口语自动识别阿尔茨海默症的竞赛吸引了包括MIT、首尔大学、德国人工智能研究中央等环球34支军队参赛;百度研究院89.6%的准确率超越MIT等天下顶级对手,以第一名的成绩摘得桂冠。
据理解,百度研究院在竞赛中基于百度知识增强语义理解技能与平台ERNIE做出创新,其模型效果比谷歌BERT更好。百度研究院这次夺冠,不仅为阿尔茨海默症这一广泛存在的顽疾供应了早期诊断的更多可能性,同时也证明了措辞模型乃至人工智能在医疗领域的主要代价,为行业实现“AI+医疗”供应了全新的范例和思路。
(INTERSPEECH2020百度研究院夺魁阿尔茨海默症的竞赛)
阿尔茨海默症即所谓的“老年痴呆”,这是一种起病隐匿的进行性发展的神经系统退行性疾病,患者会涌现影象障碍、失落语、失落用、失落认、实行功能障碍以及人格和行为改变等全面性痴呆症状。随着老龄化社会到来,愈多的家庭深受阿尔茨海默症困扰,严重降落老年人的生活质量。医学界认为,阿尔茨海默症的早期诊断非常主要,及时的干预和治疗可以延缓疾病的发展乃至治愈。
INTERSPEECH是由国际语音通信协会ISCA组织的语音研究领域的顶级会议之一,这次大会正聚焦于阿尔茨海默症举办识别竞赛,探索用AI在早期来识别和诊断阿尔茨海默病情的可能性。个中,百度研究院提出的方法是利用措辞中的停顿信息,用包含停顿编码的语音转写对Transformer措辞模型进行微调,并对多次微调结果做多数表决。
经研究,停顿是阿尔茨海默症的一个主要特色。停顿信息不仅包括停顿的时长和频率,同时还包括停顿涌现的位置,比如哪两个词之间或者哪种句法构造中涌现停顿。基于此,百度研究院的研究表明在转写中加入停顿编码,利用Transformer措辞模型中的把稳力机制学习数据中的停顿信息,可有效识别阿尔茨海默症。
(图1:停顿编码的流程)
在竞赛过程中,百度研究院首先是对语音和转写做逼迫对齐,根据逼迫对齐得到的停顿时长对停顿进行编码。在考试测验了两种编码,分别包括三种停顿(3p:<0.5s,>2s)和六种停顿(6p:<0.5s,>4s)之后,百度研究院再在转写中加入这些编码,如上图所示。
(图2:微调的流程)
第二步,百度研究院将识别阿尔茨海默症作为措辞模型的一个下贱任务,用包含停顿编码的转写对预演习的措辞模型BERT和ERNIE进行微调,其流程见上图;末了创造,通过微调预演习模型得到的分类结果有较大的不稳定性。为战胜这一问题,百度研究院又采取了多次微调并对结果做多数表决,有效提高了算法的稳定性和准确率。
这次对阿尔茨海默症停顿特色的研究事情中,百度ERNIE做出了巨大贡献;基于ERNIE,百度研究院算法的识别准确率得到了有效提升。结果(下表)显示结合停顿编码和百度ERNIE措辞模型得到的准确率最高,优于只利用转写(0p,不包含停顿),也优于BERT措辞模型。
(表1:在测试集上的结果)
百度文心(ERNIE)是依托百度深度学习平台飞桨打造的语义理解技能与平台,集前辈的预演习模型、全面的NLP算法集、端到端开拓套件和平台化做事于一体,为企业和开拓者供应一整套NLP定制与运用能力;个中ERNIE预演习模型首创性地将大数据预演习与多源丰富知识相结合,通过持续学习技能,不断接管海量文本数据中词汇、构造、语义等方面的新知识,实现模型效果不断进化,犹如人类持续学习一样。并且百度还将此项天下领先的NLP技能成果开放给业界,降落了NLP技能的准入门槛,让各大家当都能快速拥有构建和运用文本智能的能力,为家当智能化供应了全新的加速度。
如今,文心(ERNIE)已广泛运用于搜索引擎、信息流、智能音箱等互联网产品中,同时也在金融、电商、媒体、教诲等行业中落地,成为推动家当智能化转型的利器。在2020天下人工智能大会上,百度文心(ERNIE)还荣获了最高奖项SAIL奖(Super AI Leader,卓越人工智能引领者)。百度人工智能技能在阿尔茨海默症早期识别和诊断上的运用,既表示了“科技为更好”的核心理念,助力人们享受幸福生活,也证明了人工智能技能向不同领域延伸的巨大代价。(一鸣)
来源: 中华网
本文系作者个人观点,不代表本站立场,转载请注明出处!