人工智能在神经外科中的应用前景与可能的风险_技巧_数据
人工智能在神经外科中的运用前景与可能的风险
译者:兰州大学第二医院 神经外科 何文斌、沈云娟等
人工智能(Artificial intelligence,AI)赞助临床智能化有望在不久的将来变得越来越普遍,人工智能技能可能许可对当代医疗环境中产生的大量临床数据进行快速而详细的剖析,而这是人类无法达到的水平。随后,人工智能可能通过打破诊断、治疗和预后的限定来提高临床实践能力。此外,如果与机器人手术技能和其他手术赞助手段(如图像勾引)相结合,人工智能可能会找到进入手术室的方法,并许可更精确的干预,以减少缺点。只管环绕着即将到来的医疗人工智能潮的炒作很多,但关于发展临床智能化引起的潜在负面影响的文章却很少,这些可能包括直接和间接的后果:缺点的、演习不敷的或理解不充分的程序可能会直接产生缺点的结果,从而可能产生广泛的影响;智能化的增加利用可能会加剧由于过度依赖、缺少理解、过度自傲和对智能化临床事情流程缺少必要的当心而导致的年夜夫技能退化。许多负面征象已经在其他已经经历或正在经历“智能化革命”的行业中涌现,即商业航空和汽车行业。本综述从神经外科的角度磋商了预期的医疗人工智能革命的潜在好处和可能的后果。
关键词:人工智能,深度学习,机器学习,智能化,手术赞助,诊断,预后
神经外科一贯依赖于尖端技能,在20世纪末期发展出前辈的影像学模式之前,很少有有效的方法来无创地可视化颅内病变,目前,超声、打算机断层扫描(CT)和磁共振成像(MRI)被认为是不可或缺的诊断工具,同样,立体定位、手术显微镜、皮层电刺激和导航技能在手术室中也变得无处不在,从而提高了干预的准确性和更好的效果。虽然所有这些工具都是赞助的,对神经外科的实际履行不是必需的,但很少有当代神经外科年夜夫不该用它们。
医学领域的另一场技能革命将会通过人工智能方法实现临床事情流程的部分或全部智能化,临床上引入可行、有效和可靠的人工智能,有望通过使多种临床任务智能化,推动目前医学受限的打破(图1)。智能化可能潜在地减少医疗缺点、降落本钱、扩大医疗保健的覆盖面、增加病人的自主权。只管人工智能估量将首先改变医疗照顾护士的非干预性方面,但如果与机器人手术技能或手术赞助技能相结合,智能化可能会越来越多地进入手术室。
图1 AI技能、子域和潜在医学运用的示意图。运用示例并不详尽,仅代表到目前为止已证明的用法示例, 很明显,人工智能方法具有潜在的适用性,从后勤和秘书性子到关键的诊断,决策和干预任务,应运而生。
越来越多的高影响力医学和非医学文献阐述了人工智能的优点,然而,由于许多事情仍处于起步阶段,还没有广泛的临床实践,因此,目前尚不清楚人工智能能否实现其可不雅观的代价。同样,人们对智能化程度提高可能带来的有害影响知之甚少,由过度依赖智能化引起的问题已经在其他领域如航空和汽车工业中被创造,这些领域要么已经(航空)、要么正在经历(汽车)“智能化革命”,随后,如果在医疗领域涌现广泛的智能化,可能会涌现类似于发生在商业航空和汽车行业的事件。这篇综述在描述了人工智能的潜在好处和可能后果的同时,也强调神经外科实践中易受部分或完备智能化影响的特定方面。
加强神经外科智能化的基本事理
非干预性任务
当代诊断技能产生大量的数据,这些数据常日被数字化并以电子办法存储。在以前和现在,适当研究的选择、数据的提取和解释都是由人类完成的,由演习有素的专家(如影像学家、病理学家)进行粗略的阐明,可能许可在某些情形下具有高水平的敏感性和特异性;但是,人工阐明并不适用于大量数据、喧华数据的定量剖析,也不适用于描述个中包含的眇小和隐匿趋势。例如,虽然人类可以从MRI或CT数据中识别出肿瘤的宏不雅观特色,如坏去世、出血、水肿等,但人类不可能定量剖析和比较每一个切片中的每一个体素。智能化技能的运用能够以人类无法达到的分辨率和速率对数据进行快速、准确的定量处理,打算机赞助的数据剖析无论是在人群层面(多个受试者)还是个人层面(单个扫描或单个患者),都可能终极以无创性地得出高度准确的诊断和预后结论,仅利用MRI数据预测胶质瘤的分子表达是这一新生能力的一个例子,而以前,通过侵入性方法得到的组织样本须要进行分子水平的剖析。因此,人工智能在医学如神经科学领域的运用潜力是巨大的,并由当代临床环境中产生和存储的大量数据支撑,专门的程序可以运用于多模态临床数据源,如字母数字电子康健记录、实验室报告、二维和三维放射扫描以及用于剖析的拍照临床图像。根据所利用的技能,人工智能可以用于自动化和增强完成临床任务的能力,从而潜在地减少人工事情包袱,提高准确性和减少缺点(拜会图2)。
图2 机器学习和临床任务中有监督、无监督和强化学习的子领域的示意性概述。监督学习利用回归技能,并可用于临床预测任务,如预后和预测治疗反应。无监督学习涉及利用数据中的特色对数据进行聚类,其最明显的用场是识别放射扫描或临床图像中的特色,或识别临床干系的数据聚类,无监督学习技能可用于患者选择、诊断或其他须要模式识别的任务。强化学习利用“智能主体”分配一个特定目标的观点,它在实行任务的过程中驾驭环境,每一次靠近目标的行动都会得到褒奖,每一次阔别目标的行动都会受随处分。因此,算法学习最大化它的褒奖并且尽可能有效地完成它的任务,它可以用于诸如资源分配之类的任务,或者潜在地用于自动机器人手术和赞助设备的掌握机制。
干预性任务
存在手术赞助设备,以确保最大程度地提高干预的准确性和程度,并最大程度地减少对功能或主要构造的附带危害,目前,虽然赞助设备本身可能非常繁芜,但它们的实际用场仍旧节制在手术年夜夫手中,因此,一个赞助设备的好坏取决于利用它的人。外科年夜夫的手术技能本身就依赖于大量的生理和生理成分,23.7%至27.8%的神经外科缺点是由技能不良引起的,利用“智能化”外科赞助设备,如自定位显微镜、内窥镜或导航技能,可以使手术过程更快、更准确,减少人为成分造成的技能缺点和附带危害。此外,由于外科机器人手术已被公认具有相对付人类机动性的某些关键机器上风,因此,将机器人赞助设备与前辈的传感技能(机器视觉、触觉和运动学传感器)和自动化掌握程序相结合,可能会增强和扩展人类外科手术能力,使其超出目前的极限。
机器学习和深度学习
机器学习(Machine learning,ML)是一种人工智能,它涉及利用具有已知输出或特色的数据来演习程序,并且类似于将要实行的实际情形(图3),通过利用这些数据进行演习,当涌现实际情形时,程序可以随后预测输出或找到干系特色,由于输出是预测,因此它可以演习的数据集越大,当呈现新数据时,它的预测就越准确可靠。虽然有许多不同形式的连续和分类数据的ML策略,但作为ML的一个分外子集,深度学习因其临床潜力而受到特殊关注,与范例的ML程序哀求用户供应数据分类器不同,深度学习程序可以运用于没有用户先验特色选择的原始数据集,深度学习程序是自学习的,由于它们开拓自己的数据分类器,只须要用户供应原始数据和期望的输出种别,由于展示了优于医师的上风而受到最关注的研究常日涉及深度学习技能。
图3 图示非干预性临床事情流程任务,比较人类、传统机器学习和深度学习。1、数据源由任何临床调查数据组成,用于得出诊断、预后或临床决策。在神经外科中,这可能涉及病理报告(包括组织学和分子信息)、影像学研究(各种序列如CT和MRI)、人口统计学(如年事、性别)和任何其他干系临床数据(如医学共病、血液调查等)。2、数据(以往和现在)是由人类选择和解释的;然而,机器学习和深度学习在未来可能会得到越来越多的运用。3、特色选择是指选择干系的数据特色,这些数据特色被认为与基于数据的呈现和期望的任务做出明智的决策干系。对付非自动化和有限的机器学习能力,特色选择必须由人工操作。深度学习算法本身能够完成特色选择和分类任务(4)。4、分类包括任务的剖析部分,数据被分为不同的种别,例如,肿瘤是否呈恶性。人类传统上根据他们的知识和履历来实行这些任务;然而,这可能须要非定量的直觉认知过程。传统的机器学习算法利用已经被审查的数据(即,它只被输入人类操作员认为与它完成事情干系的数据)来将数据分类到与当前任务干系的种别中。深度学习算法是一种自学习算法,能够自动进行特色选择和分类。如果随后进行剖析,特色选择和分类过程可能与人类处理数据剖析任务的办法存在显著差异。5、输出包括符合临床事情流程目的的诊断、预后或决策。
神经外科智能化的现状和未来
诊断方面
目前,选择得当的成像办法和序列,以及随后的成像数据剖析,在很大程度上仍旧依赖于人类自身。智能化将对神经成像过程产生重大影响,从序列选择到图像阐明和某些条件的快速检测,迄今为止,人工智能程序已被运用于图像序列,以实现肿瘤自动分类、预测胶质瘤特色、诊断急性缺血性事宜或动脉瘤等,而且,在一些研究中,人工智能方法在诊断任务上靠近或超过了专科年夜夫。基于机器剖析的一个关键上风是,它们能够从常规的成像序列中提取和剖析大量的数据(包括分子信息),这对人类操作员来说是不可能的,其他将从智能化中获益的诊断领域包括精力病理学(特殊是组织病理学和基因组剖析)、电生理学和电子康健记录的文本分析等。
治疗决策方面
术前操持和结果预测可从智能化中获益。在术前操持方面,已经建立了自动分割肿瘤、定位致痫区域、打算蛛网膜下腔出血后血管痉挛风险、预测脑卒中对组织的损伤和治疗效果以及选择儿童癫痫手术最佳办法的程序。智能化可能通过预测神经肿瘤和创伤的存活率来提高疗效,从而帮助治疗选择或患者分层。此外,早期的回顾性研究表明,与人类年夜夫比较,智能化程序在某些预后任务方面具有上风。
神经肿瘤
肿瘤学已经进入组学领域,紧张得益于高通量技能和打算框架的打破,这些技能提高了诊断和预后的准确性,许可根据个人自身的分子特色进行治疗(“个性化治疗”)。然而,由于这种指数增长的准确性,分类和治疗选择已经变得更加繁芜,可能使老年患者分层和治疗选择理论过期。人工智能可以通过自动化预测和治疗选择任务来办理指数级增加繁芜性的后果。只管如此,在利用IBM的Watson超级打算机进行肿瘤治疗的实际环境中,早期采取人工智能进行决策任务的做法至今仍未取获胜利(拜会“非手术缺点”一节)。
手术赞助
神经外科手术赞助也可能从智能化中获益,引进一种手术显微镜,能够利用预先确定的、影像学衍生的解剖标志进行半自动定位,证明了其在颅内和脊柱手术中的运用潜力。人工智能也可能有利于图像勾引赞助,利用术前或术中得到的成像数据来赞助手术轨迹方案。其他潜在的智能化手术赞助将在关键构造(如血管或功能区)被陵犯时提醒手术年夜夫。所有这些方法都旨在最大限度地提高干预的准确性,同时最大限度地减少潜在的附带危害和术后功能毛病。
外科手术机器人
将来,干预性任务也可能部分或完备自动化。外科手术机器人已经具有超越人类灵巧性的关键上风,例如抗疲倦性,更大范围的轴向运动,抗震性和可伸缩运动;此外,传感器技能的进步,包括机器视觉、触觉反馈、运动传感和运动学已经产生了部分或完备自动化干预软组织手术的可能性。部分自主设备如Mazor X (Mazor机器人, 以色列 凯撒利亚)已经投入利用,它利用术前成像来打算和辅导椎弓根螺钉置入的手术轨迹;另一个例子是射波刀(Accuray, 加利福尼亚州桑尼维尔),用于无框架立体定向放射外科手术,这是第一个也是唯一一个真正自主化的商业手术机器人,只管它利用外部辐射束而不是直接的组织打仗。早期的动物实验证明,与人类内窥镜手术比较,自主手术机器人能够更快地完成有限范围的手术任务,而且出错更少,这显示出自主软组织机器人的初步前景。然而,机器人技能、掌握程序、传感器的大量进步,以及经由大量试验的阶段,意味着在临床上可行的、具有能够模拟人类手术性能和多功能性的自主软组织机器人在一段韶光内不太可能实现。
智能化发展的潜在风险
非手术缺点
目前,个人医疗事件最常见的是单个病人。由于智能化发展最初可能会影响诊断方面,因此高通量的临床诊断、预后和决策程序可能会导致广泛的缺点,一个真实的例子涉及IBM Watson Health的癌症人工智能程序,该程序已由天下各地的许多医院实现,它利用合成数据(如虚构的病例)进行演习,肿瘤年夜夫的输入有限,同时,它的许多治疗建议在实际病例中是缺点的,比如给有出血风险的病人推举贝伐珠单抗。类似地,演习程序来处理临床表现中的变革可能有困难,例如,一种诊断程序碰着了意外的数据值(如成像扫描中的异物),与经由演习的程序不同:这被称为“框架问题”,一种打算机科学观点,涉及到识别和升级公理以精确描述自治代理环境的困难。此外,当考虑访问大量的临床数据时,就会涌现数据安全和隐私问题,而这些数据须要充分演习一种程序来处理现实生活中广泛的临床表现。目前,人类的临床知识、履历和当心性彷佛仍旧是大多数诊断和决策任务所必需的。
外科手术缺点
18%至37%的神经外科手术失落误可归因于设备数据丢失或设备故障。虽然干预机器人的能力目前还处于抽芽阶段,但我们之前已经强调了市场上已有的几种赞助和半自主设计,它们的利用可能会越来越多。考虑到诸如自动显微镜、内窥镜或机器人等许多设备将通过减少人类的事情包袱来实现自动化的目的,频繁利用可能会导致技能障碍,并可能增加与设备干系的缺点的几率。最近FDA对Brainlab Spine & Trauma 3D Navigation 1.0系统(Brainlab,德国,慕尼黑)进行了一级召回,该系统缺点地显示了外科解剖构造,并可能导致在禁绝确的部位进行手术,这证明了技能直接导致神经外科缺点的可能性。这再次表明,只管技能效果明显,但人类仍有必要保持当心。此外,如果利用职员过分依赖这些方法,他们的技能技能发展可能会受到不利影响,在意外情形下导致技能缺点,设备数据丢失或故障,或在没有高等帮忙的情形下操作。
年夜夫技能退化程度
与引入其他技能创新(例如电子病历和临床照顾护士路子)有关的数据表明,遍及的临床技能可能会通过降落年夜夫的临床知识,对患者造成陈规定型不雅观念并降落其对决策的信心而对年夜夫产生负面影响。如果智能化技能被证明是有效的,那么社会和市场力量就有可能进一步侵蚀人类的自主性,这可能使医师技能普遍退化,从而在技能涌现故障或缺少技能时,使人类医师无法有效地供应足够的治疗。2015年的一项研究便是对此征象的例证,该研究表明,过度依赖自动决策支持系统的放射科医师在阐明没有此支持的扫描数据时具有较高的假阴性率。此外,这种情形可能类似于商业航空业的情形,商业航空业已经依赖于智能化:人类可能在临床事情流程中沦为被动的不雅观察者,进一步恶化其能力,或可能导致监督失落误(见“其它行业的履历教训”一节)。
程序黑匣子
神经网络程序由许多层相互连接的“神经元”(因此在卷积神经网络中称为“卷积”)组成,因此,输入到输出的处理机制可能是未知的,这被称为“程序黑匣子”,这是一个来自工程学的术语,个中“黑匣子”是一个设备或系统,它的内部事情办法是未知的,或者对操作者来说是不透明的。黑匣子在临床环境中存在问题,由于任何药物、医疗设备或过程都应在用于人类之前充分理解,此外,某些深度学习程序实质上是自学习的,而不是为了完成学习任务而“锁定”的。因此,在演习和开拓深度学习程序的神经连接之前,可能无法完备理解其事情事理。
未经证明的功效
环绕临床人工智能的炒作是大量的,但在早期阶段,这些程序的实际有效性从根本上缺少证据。此外,许多据称证明程序与人类平等或优胜性的研究论文仍作为预印本,有待同行严格审查。另一点须要考虑的是,程序演习须要真实的临床数据来许可它们适用于实际的病人。利用合成数据的危险已经在之前被强调过,并且为了得到演习程序所必需的大量真实临床数据,在保密性、数据隐私性和安全性方面产生了困境。例如,在打算机科学领域,用于程序演习的数据集常日在研究职员之间自由共享,这对付大多数包含患者标识特色或其他敏感信息的临床数据是不可行的。战胜这些障碍对付演习有效的、通用的临床程序至关主要。
任务环境
目前,许多临床人工智能的打破都涉及到在非常有限的(实验)环境下实行单一临床任务的程序,例如通过成像数据对胶质瘤分子表型进行无创预测,只管这可能提高诊断力、预后和治疗操持方面的内容,但它仍旧不能取代人类剖析能力的多样性。人类诊断专家具有同时评估多个特色的能力,如解剖、水肿和出血,以及许多其他特色,这些特色在临床上与确定肿瘤的分子特色同等主要。同样,只管智能组织吻合机器人(STAR)能够在高度掌握的实验环境下自主完成猪肠的体内吻合,但这只是构成完全手术过程的浩瀚繁芜部件之一。这两个例子强调,虽然有希望,但目前智能化只能实行有限范围的临床任务。为了靠近或超过人类年夜夫的诊断或治疗能力,许多程序必须同时运行,每个程序都能实行不同的剖析或功能任务。并行或顺序运行多个程序将涉及更繁芜的集成,从而增加了出错的可能性。这与航空业的情形类似,人们对驾驶舱自动化过程的程度感到担忧。
数据过度拟合
人类年夜夫通过闇练地处理一系列急慢性临床情形来展示他们的多能性,他们充分处理当前问题的能力来自于他们的核心临床知识和技能,以及他们以前处理类似问题的履历。显然,对付一个靠近人类能力的自动化系统来说,它还必须接管培训,以处理它在现实生活中将要面对的各种可能的状况。为程序培训访问适当的大量实际临床数据可能会带来数据安全和后勤方面的寻衅,由于它可能须要跨机构或国家共享数据。此外,当利用来自单一机构或患者组的临床病例演习程序时,该程序可能会因演习病例的临床和人口学特色而产生固有的偏差,从而限定其更广泛的适用性,并须要更高等别的人类当心以避免缺点。
人工智能在其他行业的履历和教训
航空业
医学和航空的相似之处在于它们都必须确保安全,缺点可能会导致身体侵害。自20世纪中期以来,商业航空已经经历了一场智能化革命。本日,商业翱翔大多利用自动导航、制导、空速和高度掌握系统。所有这些都许可当代航空旅行的高容量和高安全性。只管如此,几起事件还是让翱翔员对驾驶舱自动化系统的依赖和理解产生了疑问。最近,两起涉及波音737 Max-8模型客机的事件被归因于自动防失落速系统,翱翔员要么没有完备理解,要么无法掌握,终极导致飞机坠毁,导致机上所有人去世亡。在此之前,其他几起备受关注的灾害匆匆使监管机构调查高度智能化的后果及其对手动翱翔技能的影响。抵牾的是,只管智能化总体长进步了商业航空旅行的安全性和效率,但将传统上由人类实行的任务委托给机器却产生了切实的技能退化效应,这种效应只有在设备涌现故障或危急时才会显现出来。此外,对自动化系统的过度自傲可能导致人类翱翔员不能充分地监控飞机的内部和外部条件。这一征象被确定为2013年UPS 1354航班坠毁的缘故原由,翱翔员在自动着陆进场时未能监测高度。
汽车业
在美国,每年有600万起车祸,超过三分之一的车祸导致去世亡或受伤。因此,将部分或全部手动驾驶任务自动化可以提高汽车运输的安全性。美国汽车工程学会(Society for Automotive Engineering)引入了一个6分制的量表来描述机动车的自动化水平,该量表已被运用于医学领域的人工智能中(见表1)。在自动化水平3级或以上,汽车转向和加速部分(水平3)或完备(水平4和5)自动。然而,在这些能力的实际测试中,发生了几起涉及自动驾驶汽车的事件:在2018年,一辆自动掌握(3级自动化)车辆未能感知行人,导致了致命的碰撞。类似地,涉及各种半自动驾驶特性的事件也造成了去世亡。个中之一是,利用自动“巡航掌握”(2级自动化)的汽车与卡车的后部发生碰撞,由于其传感器由于其配色方案而无法识别车辆的后部。这是一个非医学的框架问题的例子。对自动驾驶车辆缺少足够的监控也产生了缺点,比如2018年特斯拉(Tesla) Model S在利用“自动驾驶仪”(autopilot)自动转向和巡航掌握功能时发生撞车事件。在这起事件中,据称司机被手机分散了把稳力,在事件发生前80s内没有碰方向盘。
表1 表中比较自动化程度,根据汽车工程师学会改编自动化规模。范围从0(没有自动化)到6(完备自动化,不须要人工干预)。谈论了不同自动化水平的神经外科任务(诊断、干预程序和监测)的表现。这与汽车和航空的自动化能力形成了比拟。
履历教训总结
虽然一些早期的医疗智能化引起的缺点将是不可避免的,而且会类似于目前公路车辆自动化的“初期问题”,随着技能的进步,智能化可能终极会带来与大多数商业航空旅行类似的安全效益。在这方面,智能化可能终极会纠正目前所见的大量由系统性医疗缺点引起的去世亡。只管如此,智能化的“双刃剑”很随意马虎被先前突出的来自航空和汽车行业的例子所表示。纵然智能化机制常日有效、安全并因此在商业上可行,这些成分本身并不能利用户理解或完备掌握它们。
潜在的缓解策略
调度履行步伐
不管它们一开始看起来多么有希望或可能产生的明显经济效益,必须确保技能的效率、准确性和可靠性。临床程序该当是机器可理解的(即没有黑匣子);定量地加强临床事情流程;它该当足够大略,以便其预期的运营商利用;它该当是干系的,并为它所适用的领域供应切实的利益;它该当尊重临床年夜夫,而不是要取代他们;它该当得到同行的严格审查,并为实在行供应强有力的、可量化的根本。欧盟等一些监管机构在批准为病人供应医疗做事之前,就哀求程序必须透明。此外,与联邦航空管理局一样,联邦药品管理局(或类似机构)必须卖力设计履行和监测自动化临床系统的总体辅导方针。
强调和保持手工技能
亚专业化、前辈的诊断学、临床照顾护士路径的引入和“防御性医疗”的实践,已经导致年夜夫利用他们的核心技能和磨练的履历更少。越来越多地利用医疗智能化可能会进一步加剧这种技能退化。由于医疗智能化的整合可能因专业而异,也可能因机构而异,因此,各专科或机构应制订特定的培训程序,以确保其医师的技能标准在临床智能化引入后得以保持,尤其是在涌现危急的情形下。特殊是在神经外科方面,强调核心的手工技能,只管即便减少住院年夜夫利用自动赞助工具,可能会减少技能退化。然而,在实践中,由于韶光限定、市场力量、结果审查增加、任务问题以及为患者供应尽可能好的治疗的任务等外围成分,这一点可能难以坚持。
演习人类监控环境
除了保持传统的临床技能外,年夜夫可能还必须在现有职责之外,接管新的领域的培训,比如临床自动化系统的利用和监控。在不断增加的临床智能化的预期下,年夜夫培训或连续医学教诲该当包括对医师的培训,以提高当心其环境和患者以及他们终极可能依赖的智能化过程的运作(表2)。
表2 表格展示了各种神经外科任务智能化所带来的优点、缺陷和潜在的办理方案
结论
在此阶段,应将临床人工智能视为对人类智力和身体本色的补充,与其寻求智能化和替代人工完成的事情,不如将重点放在使诊断,决策和治疗能力超出其当前极限的自动化上。因此,人工智能增强神经外科该当包含人与机器之间的共生关系,以防止过度依赖、医疗缺点或人类退化。
参考文献:略。
本文系作者个人观点,不代表本站立场,转载请注明出处!