医学上人工智能的缺失落_模子_药物
从实验室到临床的AI运用
近年来,人工智能技能在医疗保健研究中的利用急剧增加。产生和存储前所未有的大型数据集以及扩大打算规模的能力使AI发达发展。大数据革命最大程度地增强了AI的子领域机器学习(ML),个中学习是通过暴露于预先存在的大型数据集来驱动的。这些发展共同为AI创造了新颖而令人愉快的机会,可以在多个阶段积极影响医学领域。
人工智能在医疗领域中的运用
AI最直接转变的医疗保健子领域是在皮肤病学、放射学或病理学等领域中基于图像的诊断方法。在一项首创性研究中,Esteva等人利用Google Inception卷积神经网络(CNN)架构从皮肤病变图像中对非玄色素瘤和玄色素瘤皮肤癌进行分类,并得到了与专家同等的结果。在最近的一项研究中,Campanella等人展示了AI如何通过利用针头活检病理切片的数字化图像作为模型中的特色来准确地区分前列腺癌。
这些方法都利用了一种称为深度学习(DL)的ML类型,它是深度超过三层的神经网络,是打算机视觉领域的主要组成部分,旨在广泛仿照人脑中神经元的活动。传统上演习神经网络时,特色(在模型中输入的不同数据)和每个特色的主要性之间的关系是未知的。因此,每层中每个神经元的权重是随机分配的。但是,这可能会导致演习韶光变慢,由于一个人的模型必须从头开始“学习”这些关系。预演习神经网络,利用先前演习过的模型的权重初始化网络的能力许可更健壮的模型,这些模型可以更快地进行演习,从而使其非常适宜繁芜的多维问题。只管DL常常因缺少可阐明性和打算本钱而受到批评,但这些方法显示出的准确性与受过演习的临床年夜夫相称,或在某些情形下优于演习有素的临床年夜夫。
AI驱动的诊断背后的紧张驱动力之一是可用于演习算法的大量图像。电子康健记录(EHR)是大数据的另一个来源,为基于AI的剖析供应了巨大的潜力。EHR供应了一个独特的机会来利用广泛的韶光序列患者数据,个中包括有关诊断、治疗、复发和合并症的信息。绝不奇怪,人工智能研究职员已经利用这些数据利用线性模型和神经网络创建了预测模型,用于各种患者照顾护士问题,例如患者再次入院或发生特定医疗事宜的风险。
除了DL,线性模型对付在医学中采取AI也是必不可少的。线性模型有很多不同的种类。但是,它们都依赖于这样的事实,即特色与所预测的变量之间存在潜在的线性关系。这个基本事理无疑限定了线性模型在繁芜情形下的适用性。但是,它使研究职员可以清楚地理解每个功能对预测的影响,从而使其难以阐明。因此,这可能很有吸引力,尤其是在生物学中,须要对底层机制有清楚的理解。例如,在临床试验空间内,Geeleher等人演习了线性模型来利用患者的遗传状况预测药物疗效。近年来,线性模型已成为理解基因组学对药物功效的影响的标准方法。
还建议利用AI为患者创建工具,而不是专门为临床年夜夫和/或研究职员创建工具。详细来说,已经引入了谈天机器人,该机器人利用称为自然措辞处理(NLP)的AI的专门领域,以帮助一样平常医学素养和诊断。Comendador等。创建了Pharmabot,这是一款专门为帮助父母或患者阐明通用儿科药物的机器人。其他示例包括Ni等人的事情,个中他们创建了谈天机器人Mandy,该谈天机器人将便利与低级保健患者进行访谈以自动化患者摄入并开始诊断过程(图1)。总体而言,面向患者的运用程序是合并AI的一个有趣领域,它有可能完备改变当前的患者照顾护士模式。
受AI影响的医学的另一个紧张领域是早期/临床前药物开拓,该领域受高失落败率困扰,个中超过98%的所有临床前资产在投放市场之前就失落败了。随着高通量筛选和基因组技能的涌现,研究职员变得更随意马虎得到可以输入到AI框架中的大规模,受控实验数据集。最近,我们的小组和其他研究职员表明AI可以利用弘大而多样的数据集来办理药物开拓的多个阶段,例如识别新的靶标或药物候选物,将现有化合物定位为新的适应症或根据预测的不良事宜使候选化合物脱险(图1)。
对AI驱动的药物创造的兴趣最近导致了许多财团的努力。例如,逆向工程评估和方法对话(DREAM)项目组织了各种寻衅,重点是临床前研究问题,向社区开放以建立和测试打算模型。2014年,DREAM项目与美国国家癌症研究所(NCI)互助开放源代码,以利用基因组和蛋白质组学数据预测乳腺癌中的药物敏感性。最近,阿斯利康(AstraZeneca)与DREAM互助,利用高通量功效数据环绕药物组合协同效应的预测提出了新的寻衅,个中顶级方法预测了大多数协同药物组合,其缺点率与生物学重复相同。
总而言之,我们已经看到了如何利用广泛的AI算法(线性模型,神经网络,NLP等)来利用多种数据类型来办理医学多个方面的问题。
何时以及如何使模型可阐明
何时承担可阐明性的重担
关于AI(尤其是DL)与医学的集成的最大批评之一因此为AI是“黑匣子”。这是指这些算法如何进行预测时缺少明确性和透明度,这归因于DL哀求大量变量(即每个神经元的权重)和繁芜的根本构造(体系构造,丢失函数,激活函数等)。缺少模型的可阐明性导致科学界显著地退缩,由于很多时候,预测背后的“缘故原由”与预测本身一样主要。这是该领域内一个经由负责辩论的主题,个中许多都指向由于伪像而实现高精度的模型示例。例如,如果一个人试图预测患者的白细胞计数并利用一天中的韶光作为输入,那么这可能会导致表面上较高的准确性,由于AI知道后来抽血会导致白细胞计数较低。该结果是由殽杂影响所驱动的,在大多数医院中,深夜抽血大多是在紧急情形下进行的,在紧急情形下患者更可能有较低的白细胞计数。只管此类成分可能有助于提高报告的准确性,但它们在前瞻性预测中实际上没有用。
当前,有大量的研究事情正在打开难以阐明的模型的黑匣子。许多人希望为临床任务建立可阐明的DL模型可以帮助加速这些方法在现实天下中的履行。如果临床年夜夫可以轻松地理解为什么模型预测了某种诊断/预后,他们将更乐意将其用于实际患者,由于他们可以减轻对模型完备基于伪影进行预测的担心。但是,在诸如AI在诊断中的运用的情形下,建议的事情流程将用于预测模型以辅导人类决策,而医师/医学专家会审查每个单独的预测,因此限定了模型完备透明的必要性。例如,当前正在进行的一项临床试验(临床试验编号:NCT03705650)正在丈量EchoGPS(一种由AI驱动的软件)在非超声检讨专家从超声图像中检测某些心脏疾病时的有效性。该软件仅在评估超声时辅导医疗专业职员,而不是替代人类的诊断。当然,当捐躯任何数量的可阐明性时,都须要权衡取舍,只管准确性可能更高,但是可能会保留系统性的偏差,否则可能会被捕获。因此,在选择如何优先考虑模型可阐明性时,理解给定模型将如何运用于现实环境中非常主要。
可阐明性和透明度特殊主要的医学领域之一是临床前和早期药物开拓。这里须要可阐明的模型,不仅要避免模型依赖无关变量的可能性,而且要揭示潜在的浸染机理,更好理解可能会导致更好的药物定位和毒性意识,终极助长下一代候选药物的产生。因此,旨在回答诸如“该药物是否具有毒性”或“该药物对哪种疾病有效”之类的方法的方法应确保可以清楚地阐明模型背后的缘故原由。对模型可阐明性的这种尽职调查和优先级排序可以通过更全面地理解化合物、靶标或疾病来增强AI驱动的药物开拓。
模型选择
模型的可阐明性可以通过多种办法实现。但是,模型的选择和合理的特色工程可能会产生最大的影响。根据预测性能(通过测试集或交叉验证)确定多次选择模型。根据模型和根本数据,更适宜利用不同的指标。例如, AUROC是常用的性能指标;但是,它可能会引起误导,并且会在种别严重失落衡的问题上人为地浮夸其词。这些模型的性能将通过AUPRC更好地衡量。研究者探索了通过EHR预测2型糖尿病患者深度模型选择的观点。他们的事情表明,评估各种不同的性能指标可以确定最得当的模型。但是,很多时候可以根据根本数据来缩小选择要测试的模型的类型。选择精确捕捉特色之间关系的一类模型将导致更好的性能和更高的清晰度。
线性模型的可阐明性
线性模型常日被认为是ML模型中最透明的一类,由于可变系数可以用来表示每个特色对输出的影响。结合了套索和岭回归罚分的一种线性/逻辑回归弹性网络已被广泛用于癌症中的生物标志物预测。由于其可阐明性。ENCAPP是一种基于弹性网络的算法,在预测癌症的预后方面具有显著的预测能力,并着重强调了模型中的主要变量如何代表生物标志物候选物。当线性模型适宜当前的问题时,它们是一种强大的方法,可实现强大的模型可阐明性。
非线性模型的可阐明性
只管线性模型是可以阐明的,但是当问题实质上是非线性时,它们的精度会很低。随机森林是一种基于决策树的方法,是一种广泛利用的非线性模型,可用于阐明。基于决策树的模型常日可用于输出共识树,具有明确定义的决策点,使科学家能够理解预测背后的潜在缘故原由。基于决策树的模型已成功地预测了药物性子。通过共识树或特色主要性剖析,模型透明性的额外小步骤将广泛有益于这些模型的实用性。
很多时候,当利用非线性干系且实质上繁芜的数据类型时,就须要更繁芜的模型类型,例如神经网络。正如Wainberg等阐明说,神经网络可以对变量相互浸染进行建模并输出假设的中间变量,这些中间变量是隐蔽层中神经元的值。Pawlowski等人证明了倒数第二层代表繁芜特色的用场,当时他们利用这种特色工程技能对显微镜图像中的单个细胞进行了分类。终极,彻底表达变量之间关系的能力使DL在处理繁芜数据类型时成为有吸引力的选择。
特色选择
特色工程是提高任何算法的预测能力的另一个关键步骤,并且可以提高模型的清晰度。由于拥有大量可用数据,因此必须谨慎选择功能,这不仅须要确保模型性能,而且还要确保模型的可阐明性。如果忽略或缺点处理了特色选择,则在不同模型类型之间可能会发生许多陷阱。例如,数据泄露是一个问题,当包含取决于您的预测变量的功能或在预测时否则无法利用的功能时,将导致性能指标膨胀,终极导致模型无用,而与模型类型无关。此外,从DL模型中提取特色(涉及将末了一层的值用作特色)已成为图像剖析中广泛利用的技能。只管这种方法可以产生大量的信息功能,并为模型准确性带来有利的结果,但除非进行了适当的尽职调查,否则常日不清楚这些功能代表什么。如果不强调创建可阐明的工具,那么个中许多成分很随意马虎被忽略。
常日根据特色对预测能力的影响来选择特色,这种方法可能会忽略其他关键特色,例如现场的先验知识和数据可访问性。很多时候,在创建/测试预测模型的过程中进行特色选择会确认以前已知的关联,例如BRCA1预测会发展为乳腺癌或卵巢癌。但是,当评估大型数据集时,纵然经由实验验证的关联也可能被数据的整体噪声淹没。因此,整合专家知识的努力可以确保预测是由潜在的生物学机制驱动的,从而使该模型不仅更具阐明性,而且更加可靠。最近,Javanovic等通过结合利用传统选择技能和领域知识创造的特色,利用Tree Lasso正则化模型来预测小儿再入院。他们创造,与利用传统的套索模型比较,此结果模型更易于阐明,而性能没有明显丢失。这凸显了一个事实,即可阐明性不须要与预测能力的权衡取舍。但是,该当指出的是,完备或过于依赖专家知识可能会加剧已知的系统偏见并限定科学创造。因此,对特色主要性的详尽搜索对付确保完全的模型透明度和生物学理解至关主要。
与其他方法类似,可以以大略的办法为神经网络完成特色贡献的识别。一种常见的技能是向后传播所有神经元以分配其贡献。在处理图像数据时,可以利用反向传播创建显著图,该显著图可以直不雅观地表示每个特色的主要性。当前和未来的临床面临算法可通过合并诸如此类的特色选择技能来受益,以帮助提高模型的可靠性,并确保它们不基于噪声或系统偏差。
多样性丰富模型的主要性
跨数据类型的多样性
大数据时期已影响到科学的大多数方面,从而为AI供应了通过大量数据类型进行丰富演习的机会。不幸的是,许多当前的模型方法将其自身局限于特定的数据类型。只管这些模型已经得到了高性能,并已证明在药物开拓和临床流程中发挥了主要浸染,但短缺各种数据类型的整合。过去的研究中,研究者已经展示了如何结合各种类型的数据来提高许多早期问题的整体预测能力和可阐明性。例如预测基因的必要性和药物毒性。正如Cheng等人(2003)所述,异质特色的结合可以更好地捕获潜在的机制。通过预测药物相互浸染来证明这一点。虽然此示例着重于早期创造,但具有更多样化数据的预测能力的增强和预测模型的可阐明性适用于所有AI。当试图回答药物开拓和临床决策中的未办理问题时,真正的跨学科方法是得到完全理解并得到最准确和可靠结果的唯一方法。
合并各种数据类型虽然对预测模型有代价,但必须谨慎进行,以避免常见的陷阱。由于增加的特色或更高等的模型体系构造,多样化数据集成中的一个共同寻衅是增加了模型繁芜性。一个例子是多视图学习,这是一种增强模型体系构造以集成各种特色类型的方法,由于其灵巧的体系构造,在神经网络中尤其常见。只管多视图模型已经在医学上取得了成功,例如胎儿超声图像,但它们的演习难度更大,并且可能更随意马虎过拟合。繁芜模型中的一个普遍问题。但是,只要牢记这些寻衅,合并各种数据类型将对将来的医学模型有益。
样本间的差异
除了合并各种特色之外,利用各种不同的样本还可以提高模型的适用性和整体性能。常日,确保将噪声限定在数据范围内会导致问题,即没有足够大的人口来创建故意义的预测模型。因此,只有适当地包含不同的样本,AI的广泛运用才有可能。例如,在药物开拓领域,Yuan等人提出了一种多任务模型来预测不同癌症类型之间的药物疗效。由于对癌症类型和药归天合物之间的深入研究,该当对模型进行针对特定药物或癌症类型的演习。但是,通过利用多任务方法模型可以从所有这些样本中得到的信息中受益,终极实现更好的性能。多任务方法的运用在用于药物开拓的AI中得到了发展。这在很大程度上可以归因于其赛过先前模型并避免诸如过度拟合之类的陷阱的能力。因此,未来在医学中的AI运用应集中在样本多样性的纳入上,以丰富性能并确保模型的广泛适用性。
结束语
到目前为止,从实验室到临床的ML和AI运用都非常强大。但是,随着该领域的不断发展,有许多事情要牢记。为了确保AI在医学上的运用发挥出最大的潜力,主要的是生物学必须始终处于模型和实验设计的最前沿。在早期药物开拓的情形下,可以通过在预测算法中优先考虑可阐明性来实现,从而理解潜在的生物学机制。虽然辨别生物学机制对付更多面向患者的运用可能不太主要,但强调可阐明性将有助于确保模型可靠且基于真实旗子暗记。在某些情形下,可以设想,将可阐明的AI运用于病理图像将揭示以前看不见的模式,例如细胞之间的间隔以及基质身分的主要性等。医学天生便是跨学科的,该当反响在用于预测算法的特色和样本中,从而许可以系统地理解问题,并在许多情形下提高准确性。丈量模型性能的时期结束了。模型评估必须同时考虑性能和可阐明性。
药物创造已进入下一个领域,我们只看到即将到来的变革的开始。我们相信,随着AI在药物开拓领域的进步,实验事情将通过AI而不是反之为根本。例如,利用高度可阐明的模型可以帮助您确定哪些特色最有用,从而可以相应地设计实验筛选。此外,通过透明的AI努力,我们可以开始理解药物背后的机制,从而可以进行更精确的临床试验。在许多情形下,阻挡患者接管挽救生命的疗法的唯一缘故原由是对这些药物缺少透彻的理解。我们必须利用AI授予我们的设计能力,
虽然构建可阐明,高度预测和强大的模型是医学界成功进行AI研究不可或缺的一部分,但它依赖于可重复的事情。代码共享和开释利用的数据集是确保预测模型的可阐明性和总体有效性的关键。高性能ML库已经使AI研究普遍化,并许可不仅利用这些模型,而且还被各种研究职员所理解。除了开源代码之外,还须要利用所有利用的数据集来理解各种特色如何相互浸染和影响模型,因此是构建可阐明模型的必要步骤。模型的可阐明性不仅限于创建这些工具的研究职员,而是全体领域的哀求。
总体而言,人工智能已经在医学的各个领域取得了长足的进步,从药物创造到临床决策。我们认为,只有在我们连续优先重视生物学理解和数据/模型多样性以及预测性能的条件下,这些进步才会连续增长。
参考资料
The Missing Pieces of Artificial Intelligence in Medicine. Coryandar Gilvary,Neel Madhukar,Jamal Elkhader,Olivier Elemento.Trends in Pharmacological Sciences.Elsevier.August 2019
本文转载自其他网站,不代表大康健派不雅观点和态度。如有内容和图片的著作权异议,请及时联系我们(邮箱:scarlet.s@djkpai.com)
【医健科技讲堂】第六期预报
主题:《以患者为中央的医院聪慧门诊培植》
韶光:5月8日(周五)15:00-16:00
高朋:王志斌富通东方数字化智能奇迹部总经理
报名:添加小助手wx【jiankangwaner】入群获取报名入口、更多资料、往期回看
【医健科技讲堂】往期回顾
本文系作者个人观点,不代表本站立场,转载请注明出处!