麻省理工科研团队研发新型人工智能模型可经由进程睡眠呼吸检测诊断帕金森 | 科技导报_暗记_旗子
美国麻省理工学院电子工程与打算机科学系的Dina Katabi教授带领团队设计了一种AI模型,能够实现利用夜间就寝的呼吸旗子暗记来诊断帕金森症,并检测其严重程度。
帕金森病是一种常见的神经系统退行性疾病,目前我国帕金森病的均匀患病年事为60岁,患者已超300万人,近年来,研究显示该病已逐渐呈现年轻化的趋势,青年型帕金森病患者约占总发病人数5%-10%。
与弘大的患病人群比较,普通民众对该病的认知却十分有限。很多人对帕金森病的印象还勾留在“手抖”、“行动迟缓”等临床表现上,但实际上,涌现明显症状时,患者就已经处于病理发展到后期了。因此,早创造就能为患者赢得宝贵的治疗韶光。
8月22日,美国麻省理工学院电子工程与打算机科学系的Dina Katabi教授和她的团队在Nature Medicine上揭橥了一项研究,该研究以“Artificial intelligence-enabled detection and assessment of Parkinson’s disease using nocturnal breathing signals”为题,先容了一种人工智能模型,其可通过读取人就寝时的呼吸模式来检测帕金森病。
干系论文(图片来源:Nature Medicine)
该人工智能模型得以研发成功采取了哪些理论根本和技能手段?运用前景如何?《科技导报》新媒体就此专访了论文一作麻省理工学院电气工程与打算机科学系助理研究员杨宇喆,第二作者麻省理工学院电气工程与打算机科学系博士后研究员袁园,两位也是本文的通讯作者。
您可否简要先容下能够通过夜间呼吸监测帕金森的人工模型这一科研成果?
杨宇喆:我们的研究,一句话概括来说是设计了一种AI模型,能够实现利用夜间就寝的呼吸旗子暗记来诊断帕金森症(Parkinson's disease,PD),并检测其严重程度。
我们的事情也首次证明了就寝呼吸旗子暗记是帕金森疾病的一个数字生物标志物(digital biomarker)。我们进一步通过无线旗子暗记检测呼吸的事理,实现了能够在患者家里支配、且无任何身体打仗的疾病诊断、严重程度检测,和长期病情跟踪的系统。
它打破了哪些核心难题?或者说它最大的意义和代价是什么?
杨宇喆:研究背景上讲,目前没有用于诊断帕金森病或跟踪其进展的有效生物标志物。帕金森病是一种繁芜的神经退行性疾病,也是天下上第二常见的神经退行性疾病,影响着约1%-2%的65岁及以上老人。
随着环球人口老龄化,帕金森病发病率还将大幅增加。目前,全天下有超过600万人患有帕金森病,每年还有约60000名新患者确诊。患者大脑中产生多巴胺的神经元损失,影响运动和认知,导致涌现震颤、肌肉僵硬、意识模糊和痴呆等症状。
然而,帕金森病难以诊断,由于帕金森病的诊断紧张依赖于震颤、肌肉僵硬和行动迟缓等运动症状的涌现,但这些症状常日在患病数年后才涌现,此时患者已经产生了不可逆的神经损伤。
多年来,研究职员一贯在研究利用脑脊液和神经影像学检测帕金森病的潜力,但这些方法是侵入性的,价格昂贵,而且须要去专业的医疗中央才能进行检测。这使得它们不适宜用来进行频繁检测,也就无法供应早期诊断或持续跟踪疾病进展。
我们这项研究证明了帕金森病与夜间呼吸症状之间存在密切联系,表明基于人工智能的呼吸模式检测模型能够创造帕金森病,评估其严重程度并跟踪疾病进展。
由于呼吸旗子暗记可以通过在家中安装无线旗子暗记设备,通过无线旗子暗记检测呼吸的事理采集得到,我们能够实现在患者家里支配、且无任何身体打仗的疾病诊断、严重程度检测,和长期病情跟踪的系统。将这些呼吸旗子暗记反馈到神经网络,无需患者自己和照顾护士职员的操作,就能评估帕金森病。
此外,帕金森症是一个及其缓慢发展的神经退行性疾病,加之由于目前缺少对病症变革程度敏感的标记物,其临床试验的持续韶光和本钱都非常昂贵(其药物开拓均匀本钱和韶光分别是13亿美元和13年),这限定了许多制药公司开拓帕金森病药物或疗法的兴趣。
因此,我们希望我们这种基于人工智能的生物标志物能够供应早期诊断,并能供应长期且敏感的病情程度变革追踪,这将有可能会助于缩短临床试验韶光,降落本钱,从而促进药物开拓。
根据干系宣布,除了能够诊断和监测帕金森病,该人工智能模型“还首次证明了就寝呼吸旗子暗记是帕金森病的一个数字生物标志物”。叨教这一创造将对帕金森的诊治带来什么样的影响?
杨宇喆:之条件到,目前临床的帕金森病诊断办法,紧张还是依赖于临床运动症状的涌现。但这些症状常日在患病数年乃至数十年后才涌现,此时患者每每已经产生了不可逆的神经损伤(例如50%-80%的多巴胺能神经元)。
目前临床的评估帕金森病严重程度的最常用方法,则是通过一个叫做“天下运动障碍学会帕金森病综合评价量表”(MDS-UPDRS)的问卷实现。这须要由经由专业培训的年夜夫根据主不雅观标准对患者症状进行分类评估和打分,而这种检测则每每非常低频(一年仅2-3次)。
而我们这项研究证明了帕金森病与夜间呼吸症状之间存在密切联系,表明基于人工智能的呼吸模式检测模型能够创造帕金森病,评估其严重程度并跟踪疾病进展。由于呼吸旗子暗记可以通过在家中安装无线旗子暗记设备,通过无线旗子暗记检测呼吸的事理采集得到,我们能够实现在患者家里支配、且无任何身体打仗的疾病诊断、严重程度检测,和长期病情跟踪的系统。将这些呼吸旗子暗记反馈到神经网络,无需患者自己和照顾护士职员的操作,就能评估帕金森病。
团队为什么选择夜间就寝呼吸旗子暗记来作为检测帕金森的切入点?
杨宇喆:实际上,早在1817年,詹姆斯·帕金森年夜夫(帕金森病正是以他的名字命名)就创造了帕金森病与呼吸之间的关系。这提示了我们,有可能在不不雅观察运动症状的情形下通过检测呼吸来诊断帕金森病。
此外,也有研究表明,帕金森病患者在涌现运动症状之前数年就已经涌现了呼吸系统症状,例如呼吸肌无力、就寝呼吸障碍、以及掌握呼吸的大脑区域退化等。
这让我们想到了,呼吸系统症状有可能用于帕金森病的诊断。于是我们提出设计AI模型,利用夜间的呼吸旗子暗记来考试测验诊断PD、监测严重程度,以及连续跟踪其疾病进展。终极的结果也首次证明,就寝呼吸旗子暗记是帕金森疾病的一个强有力的数字生物标志物(digital biomarker)。
比较于其他标志物,就寝呼吸旗子暗记在诊治帕金森时具有哪些利害势?
杨宇喆:其他现有方法,比如研究脑脊液、血液,或者神经影像等等。大部分是侵入式检测,并且须要去医院检测。有研究表明,帕金森病患者在涌现运动症状之前数年就已经涌现了呼吸系统症状,同时就寝呼吸旗子暗记可以用不同的设备很轻易采集到,比如无线射频旗子暗记等等。因此,利用就寝呼吸旗子暗记进行诊治,既可能进行早期诊断,同时也可以非打仗、非侵入、大略便捷地在家中进行检测和永劫光的跟踪。
团队展开这一研究的初衷是什么?用了多久完成?
杨宇喆:研究的初衷是探索利用远程监控技能和就寝呼吸旗子暗记去预测一些生理旗子暗记,以及进行帕金森病的早期检测和疾病严重程度的预测和跟踪。这项研究从最开始做到稿件接管,统共耗时三年。
在研究过程中,团队经历了一些困难?又是如何战胜的?
杨宇喆:第一个障碍来自于医学背景的缺失落,但这个可以通过大量阅读文献来办理。我记得刚开始做的时候我们也只有一个模糊的想法,也是通过不断阅读文献,反复考虑想法,实验验证,以及和不同医院的领域专家们谈天来探求可能探索的方向,终极逐步找到探究呼吸和帕金森症这个目标的。
其次,由于我们是数据驱动的医学研究,数据本身是最为关键的。为了能拿到足够量且分布足够多样化的数据,我们在项目开始的半年里常常奔波于各大医院找互助者谈天,展示、谈论当前最好的结果并希望能拿到更多的数据。
袁园:的确,数据是非常关键的部分,这项研究是与罗切斯特大学医学中央、梅奥诊所、马萨诸塞州总医院和波士顿大学康健与康复学院互助进行采集数据,MIT也采集了一部分对照组数据。为了有更多的数据演习AI模型,也从公开的美国国家就寝研究资源得到一部分数据(PGS data,呼吸旗子暗记全部是breathing belt采集的)。因此紧张数据来源于breathing belt和无线设备两种不同设备。
Breathing belt的数据集由于每个人只采集1-2个晚上,因此包含的就寝呼吸数据中帕金森患者比例非常少;无线设备的数据集由于每个人可以很随意马虎采集多个晚上的数据,因此包含的就寝呼吸数据中帕金森的比例和对照组的比例相称。以是演习模型的时候面临着数据集之间modality(模态)的差异以及数据集内部distribution(分布)的差异。团队花了很多韶光去考试测验不同的算法和提升实验结果,末了能把所有的数据混在一起演习出在所有数据集上表现都比较好的模型。
杨宇喆:此外,虽然我们揭橥在医学期刊,但AI系统的算法设计也是非常关键的,这是由于医学数据分布本身会为AI算法带来寻衅——大部分数据来自于康健人群,患病者则是少数,这带来了数据不平衡的难题;其次,不同医院由于采集设备的不一致,网络的旗子暗记数据可能会存在一定的差异,这对模型的泛化性也提出了寻衅。
我们创造目前的机器学习算法并没有很好的考虑到这些真实数据上的寻衅,于是我们也花了大量韶光去提升相对应的算法,终极拿到了明显的结果提升,而相应的算法创新也被揭橥在了AI/ML的顶级会议ICML 2021 [1] 和ECCV 2022 [2] 上,感兴趣的小伙伴也欢迎关注。
您可否先容下,当前最常用的诊治帕金森病的临床手段有哪些?
杨宇喆:帕金森病作为一种进行性疾病,常日会以轻微的症状开始,比如手部或头部震颤。它会影响神经系统,会逐渐导致肌肉僵硬、运动缓慢、平衡受损。随着韶光推移,面部表情会逐渐消逝。也有些帕金森患者在经历僵硬和震颤之前会涌现就寝问题、便秘、嗅觉损失等等。
当前,年夜夫常日通过检讨患者的病史和症状,并通过一些血液检测或其他检测去打消其他会产生类似症状的疾病,以及通过一些药物反应来终极得到准确的诊断。
与这些手段比较,团队这次研发AI模型的最大上风是什么?
袁园:实际上这些运动症状常日在患病数年后才涌现,此时患者已经产生了不可逆的神经损伤。有研究表明,帕金森病患者在涌现运动症状之前数年就已经涌现了呼吸系统症状,例如呼吸肌功能减弱、就寝呼吸障碍、以及掌握呼吸的脑干区域退化等。我们的AI模型正是基于就寝呼吸旗子暗记进行检测,因此能更早地创造患病的可能性,从而使患者更早地开始治疗和阻挡疾病的进展。
关于这次的研发成果,您认为是否还有值得优化的地方?
杨宇喆:首先,我们的系统用一晚的呼吸数据的检测结果是特异性和灵敏度分别达到80%旁边(若用多个晚上准确率会更高)。这意味着仅利用我们的系统,依旧存在相称的假阳/假阴的诊断结果。这就意味着模型本身表现仍须要提高,以达到能被直接支配利用的精度。
其次,我们采集的数据依旧较为有限,没有很好的包括天下上的所有人群。我们希望能连续搜集干系的数据用于AI系统的演习,能够包含不同人群、种族、性别等其他成分,而这也是使得模型能够更加鲁棒和可靠的关键。
袁园:在数据方面,虽然我们的系统测试了7687人,包括757名帕金森患者,统共超过120000小时的就寝数据,并且这些数据包含了不同的种族、年事、性别,但是早期检测的实验紧张是测试患者被诊断为帕金森综合症的6年前的呼吸数据。如果有更多和更早的数据,比如12年前乃至更早,或者早期不同阶段的数据,大概能对早期诊断有更丰富的研究。
在模型方面,我们须要进一步探索一下自监督学习,或者transformer等韶光序列旗子暗记的特色学习方法,以及更加鲁棒的模型泛化的算法。
国际上是否有同类型的AI模型,与他们比较,你们这次研发的人工智能模型的利害势是什么?
杨宇喆:国际上目前没有用AI模型研究就寝呼吸和帕金森综合症的事情,我们无论是在研究规模还是研究创造及创新上可以说都是有打破性进展的。
这种人工智能模型的运用范围能否拓展到其它疾病的诊治当中?
杨宇喆:据我们的文献调研结果,目前暂时还没有理解到干系事情深入研究其他神经退行性疾病(如阿兹海默症,Alzheimer's disease)和夜间呼吸症状的关系,以是不能妄下定论。但以往的文献也或多或少对这些神经退行性疾病伴随有临床上的夜间呼吸紊乱等症状有过分析和宣布。
我们对我们的AI系统是否能够分辨不同的神经退行性疾病做了验证。虽然样本较少,但结果显示在掌握人群变量来自同一数据集时,其能以AUC=0.895的准确率差异帕金森症(n=57)和阿兹海默症患者(n=91)。这解释AI系统是学到了和帕金森症干系的特色,而非广泛的神经退行性疾病干系的特色。
要彻底回答这个问题,则须要搜集大量其他神经系统疾病数据,演习并详细测试AI系统的表现,才能得出可靠的结论。
袁园:我们相信这种人工智能模型非常有可能拓展到其他神经系统疾病,比如阿尔兹海默症。但是在得出到底是否可能的明确结论之前,还须要采集更多干系的数据,以及进行更多的研究和实验。
据宣布,该模型诊断帕金森时的能力在held-out测试集和外部测试集上的曲线下面积(AUC)分别高达0.90和0.85,叨教这一数字后续还能否连续提升?现阶段,该模型是否存在不敷之处?紧张有哪些方面?
袁园:如果能持续网络到更多患者和志愿者的数据(比如不同年事、种族、性别、受教诲程度、患病年限等等)来演习模型,相信模型的性能和鲁棒性都会有更进一步地提升。
这种人工智能模型的运用前景如何?
袁园:我们提出的这个可以长期监测就寝呼吸旗子暗记并且作出诊断的系统和模型,比较于以前涌现症状之后定期去医院检讨,能更早诊断帕金森病,也能更客不雅观丈量疾病严重程度,有很广阔和有代价的运用前景。
杨宇喆:我们希望能连续搜集干系的数据用于AI系统的演习,能够包含不同人群、种族、性别等其他成分,而这也是使得模型能够更加鲁棒和可靠的关键。我们同时也操持连续在不同患者家中支配AI系统,获取长期的病情监测数据,能够给临床医师进行实时远程数据反馈,期待能实现无打仗式的远程医疗的可能。
您估量何时能够实现商业化运用,并广泛运用于临床诊治当中?
袁园:虽然很有前景,但是它仍处于早期发展阶段,在大规模商业化运用之前,还须要和更多医疗机构互助,采集更大规模的数据进行更全面的实验验证。
您可否谈谈团队下一阶段的研究操持与目标是什么?
杨宇喆:首先是探寻就寝呼吸旗子暗记的可拓展性,这方面会环绕就寝呼吸旗子暗记做一些不同方向的研究,也包括不同疾病的研究,如阿尔兹海默症等。
其次是探求更多远程监测的方法,以及将全体系统完全支配实现永劫光连续的病情监测和反馈。
袁园:我们团队的成员接下来会连续环绕就寝呼吸旗子暗记做一些不同方向的研究,也包括不同疾病的研究。我这边紧张汇合中在就寝呼吸和阿尔兹海默症的研究上。
参考文献:
[1] Y. Yang, K. Zha, Y. Chen, H. Wang, D. Katabi. “Delving into Deep Imbalanced Regression.” ICML, 2021.
[2] Y. Yang, H. Wang, D. Katabi. “On Multi-Domain Long-Tailed Recognition, Imbalanced Domain Generalization and Beyond.” ECCV, 2022.
学者简介
杨宇喆,麻省理工学院电气工程与打算机科学系(MIT EECS)博士生,师从Dina Katabi 教授,研究方向为机器学习和医疗AI。本科毕业于北京大学信息科学技能学院。研究事情揭橥于Nature Medicine、Science Translational Medicine、ICML、CVPR、NeurIPS、ICLR等顶级期刊和会议,并被多个主流媒体如MIT Technology Review,Forbes,BBC,The Washington Post等宣布。曾得到MathWorks博士奖学金,国家奖学金,IEEE ComSoc国际学生竞赛第一名等名誉。
袁园,麻省理工学院打算机科学与人工智能实验室(MIT CSAIL)博士后,导师Dina Katabi教授,研究方向为打算机视觉、机器学习和AI for healthcare。博士毕业于喷鼻香港科技大学电子与打算机工程系,博士期间在卡内基梅隆大学机器人系做过一年访问学者。研究事情揭橥于Nature Medicine、CVPR、NeurIPS、ICLR、ICCV等顶级期刊和会议并被多个主流媒体如Forbes、BBC、The Washington Post等宣布。
Dina Katabi,麻省理工学院电气工程与打算机科学系Thuan (1990) and Nicole Pham教授,MIT Jameel Clinic首席研究员,无线网络和移动打算中央主任,麦克阿瑟天才奖得主,美国国家工程院院士,美国艺术与科学院院士。研究方向为医疗人工智能、数字康健、机器学习、打算机视觉、无线和移动系统。
本文系作者个人观点,不代表本站立场,转载请注明出处!