在全天下范围内,有超过3亿人患有烦闷症。
个中的60%的人都没有接管任何治疗。

李飞飞新研究:人工智能可以诊断抑郁症了_抑郁_的是 文字写作

我们时有听到名人患烦闷症乃至严重到自尽的,却不知周围一些普通人身在病中不知病。

面对这一病症,AI能做些什么?

曾经说过“AI没有国界,AI的福祉亦无边界”的李飞飞老师这次要为那些疑惑自己患烦闷症的人创造福祉了,这次她和团队瞄准了AI诊断烦闷症这个方向:

结合语音识别、打算机视觉和自然措辞处理技能,通过表情和措辞诊断一个人是否患了烦闷症。

目前,这项研究初见成效,诊断烦闷症的机器学习模型目前precision达到83.3%,recall达到82.6%。

并且,这个模型可以支配得手机上,让更多人能方便的诊断烦闷症,不再受困于“没钱”、“没韶光”、“别人知道我去查烦闷症会怎么议论我”的阻挡之中。

其余,这项研究成果还入选了 NIPS NeurIPS 2018医疗康健机器学习(ML4H)Workshop。

下面,量子位为大家详细先容李飞飞这篇新作品的详细内容。

为什么用表情和措辞能诊断烦闷症?

由于年夜夫便是这么干的。

在目前的烦闷症诊断过程中,年夜夫须要和患者面对面谈天,来判断对方是否患病。

须要年夜夫来不雅观察的要素包括:

对方是否语调单一,完备不抑扬抑扬;

说话音量是否比较低;

讲话时手势是不是比正凡人少;

是不是总爱低头向下看;

……

其余,还须要通过患者康健问卷(PHQ, Patient Health Questionnaire)来调查来理解更详细的信息。

用AI来诊断烦闷症,就相称于用机器学习模型来代替那个和患者对话的年夜夫,把患者在年夜夫面前的表现变成数据,输入机器学习模型中。

因此,李飞飞团队采取的方案是先模型中输入3D面部关键点***、患者说话的音频和转成笔墨的访谈录音三种数据,分别对应下图中的abc三行。

之后,输出PHQ评分或烦闷症分类标签,就能得出此人是否患了烦闷症。

演习模型全过程

演习这个模型用到的是DAIC-WOZ数据集,包括142名患者的PHQ评分和189次临床访谈、统共50小时的数据。

全体模型由两个部分组成。

第一个部分叫句子级嵌入(Sentence-Level Embeddings)。

以往的嵌入办法都是嵌入一个音节或单词,只能捕捉几百毫秒的韶光。
李飞飞团队用的是全体句子多模态嵌入,可以实现捕捉更永劫光的声音、视觉和措辞元素。

下图便是多模态句子级嵌入的示例:

第二个部分叫因果卷积网络(C-CNN, Causal Convolutional Networks)。

之以是用因果卷积网络,是由于烦闷症患者说话慢。

比较普通人,烦闷症患者说话的时候会在不同的字词之间停顿更永劫光,因此全体句子的音***也就比较长。
处理这种长句子的时候,因果卷积网络要比RNN强。

效果如何

我们来看一下实验结果。

个中,A是指输入数据为音频,V是指输入数据为***,L是指输入数据为文本。

比拟古人的实验结果,李飞飞的这项新研究数据上相对较高。
不过,与古人不同的是,这项新研究并不依赖一些预先做好的访谈记录,以是来的背景资料更少。
并且,这项新研究无需特色工程,可以直接用输入原始数据。

这张实验结果表格比拟了利用不同嵌入办法的结果。
个中,前两行是手工嵌入,第3~6行是预演习嵌入,末了两行是我们用到的句子级嵌入,输入的是log-mel光谱图、3D面部关键点***和Word2Vecs的序列。

传送门

论文:

Measuring Depression Symptom Severity from Spoken Language and 3D Facial Expressions

Albert Haque, Michelle Guo, Adam S Miner, Li Fei-Fei

https://arxiv.org/abs/1811.08592

— 完 —

诚挚招聘

量子位正在招募编辑/,事情地点在北京中关村落。
期待有才华、有激情亲切的同学加入我们!
干系细节,请在量子位"大众年夜众号(QbitAI)对话界面,回答“招聘”两个字。

量子位 QbitAI · 号签约作者

վ'ᴗ' ի 追踪AI技能和产品新动态