「综述」人工智能在肺结节诊断中的应用及瞻望_卷积_影像
作者:
徐涛 青岛大学附属医院呼吸与危重症医学科 266000
常欢 青岛大学医学部医学影像系 266071
崔宁 青岛大学附属医院呼吸与危重症医学科 266000
刘瑶琦 青岛大学附属医院呼吸与危重症医学科 266000
高靖 青岛大学医学部临床医学系 266071
辛颖 青岛大学附属医院内分泌与代谢性疾病科 266000
郝晟瑜 复旦大学上海医学院 200032
程兆忠 青岛大学附属医院呼吸与危重症医学科 266000
于文成 青岛大学附属医院呼吸与危重症医学科 266000
白春学 复旦大学附属中山医院 上海市呼吸病研究所 上海呼吸临床质量掌握中央 200032
通信作者:白春学
Email:cxbai@fudan.edu.cn
研究表明,我国肺癌发病率居恶性肿瘤首位(57.36/10万)[1],而且无论男女,病去世率也均居第一,5年生存率只有19.7%[2],具有明显的\公众二高一低\"大众的特点:发病率高、病去世率高、5年存活率低[3]。而在ⅠA期肺癌患者中,病理为原位癌和微浸润性癌的患者术后5年生存率可靠近100%[4]。早期肺癌并无范例临床症状,可仅表现为CT影像上的肺结节,因此视角前移到肺结节筛查阶段,做到肺癌的早创造、早诊断以及规范化治疗可以有效提高5年生存率,减少病去世率。我国遗传背景及环境差异等国情不同于欧美国家,为了确定适宜我国肺癌的诊治共识,2018年中华医学会呼吸病学分会和中国肺癌同盟共同更新了\"大众肺结节诊治中国专家共识(2018年版)\"大众[5],推举利用低剂量胸部CT检讨对高危人群进行早期筛查及随访。
创造肺结节后的诊疗流程,可以大致总结为FIRST方案:随访(follow up,F)、影像学检讨(imaging test,I)、药物(respiratory medicine,R)、手术活检(surgery,S)、组织活检(tissue biopsy,T)等。
由于目前存在CT阅片数量激增、人工阅片耗时长、各地区医疗资源难以同质化等问题,导致涌现诊断耽误和过度医疗等弊端,尽早办理肺结节良恶性的鉴别诊断、早期肺癌的准确甄别及避免造成患者的过度治疗这3个至关主要的问题尤为关键,因此我们不再知足于低效检出肺结节,而是希望能够高效获取深层次更准确的信息。由于肿瘤具有空间和韶光异质性,活检并不能全面评估肿瘤的性子、生物学信息等情形,因此人工智能赞助深度挖掘影像数据实现肺结节的早期诊断及精准医疗作为前述FIRST方案的完善优化成为研究热点。
本文就人工智能紧张技能在肺结节早期诊断方面的运用进行综述,以期能更好地利用人工智能提高早期肺癌的诊断率,降落肺癌患者病去世率并提高其生存率。
机器学习是人工智能的一大领域,是一门涉及统计学、概率论、打算繁芜性理论等的交叉学科,通过设计打算机算法学习和模拟医师的诊断技能,完成特界说务。经典的机器学习分类器有决策树、支持向量机、人工神经网络等。
目前图像处理领域经典的机器学习算法紧张是支持向量机,作为一种经典的线性分类器,对付肺结节良恶性分类的运用较好,只须要小样本就可找到数据之间分类的超平面,高效办理小样本数据的分类问题。
机器学习中无论是何种分类模型,要想得到较好的预测效果,都须要输入人工标记好的、标准化的数据进行演习学习,使其依赖并受限于人工标注;比较于影像组学和深度学习的过程,传统机器学习算法冗杂掉队,在大数据处理方面也并不灵巧。
深度学习是机器学习领域一种新兴的框架技能,但优于传统机器学习算法,具有自动化和无缝调度性能的上风。深度学习可以直接从海量医疗影像的原始数据出发,利用由多重非线性变换构成的多级处理层自动对数据进行高度抽象的模式识别和深层特色提取。个中,卷积神经网络、深度信念网络和自编码器在肺结节诊断中运用较多。深度学习的运作机制可知性较低,目前研究职员也在致力于阐明其机制。Shen等[6]提出了一种新的可阐明的深层语义卷积神经网络来鉴别肺结节的良恶性,并整合语义特色于分层语义卷积神经网络模型中来预测恶性程度。
深度学习模型须要输入大量的标记过的演习数据实现高精度,小数据下的深度学习随意马虎过拟合。迁移学习[7]的涌现弱化了数据量对深度学习的限定,节约演习韶光,办理了已标记的数据不敷的问题,解除了有限的变量数对付机器学习和深度学习表达能力的限定。Nishio等[8]分别用打算机赞助检测与诊断系统方法、带有迁移学习的深卷积神经网络方法和不带迁移学习的深卷积神经网络方法对1 236例患者影像中的肺结节、原发性肺癌和转移性肺癌进行分类,准确率分别为55.9%、68.0%和62.4%,深卷积神经网络优于传统打算机赞助检测与诊断系统,带有迁移学习的深卷积神经网络分类更加准确。与其他模型不同的是,迁移学习不是从零开始,而是把已经演习好的模型参数迁移到新模型完成新的数据集演习。
卷积神经网络现已成为人工智能中的革命性观点,最初是由Fukushima[9]提出,由输入层、卷积层、池化层、全连接层和分类器层组成,是一种对输入图像重复进行添补、卷积、池化操作而实现特色提取和图像降维的前馈神经网络。卷积层利用滤波器得到高层次特色映射图,减少权值参数的个数,大幅降落打算繁芜度,而池化层通过实行非线下采样实现特色图像降维,简化了卷积层图像的输出,避免样本量不屈衡而导致的过拟合问题。
深度信念网络在2006年由Hinton等[10]首次提出,由多少个受限波尔兹曼机来构建多层神经网络,通过对每个受限波尔兹曼机进行演习使全体网络按最大概率天生数据。深度信念网络对数据的繁芜关系有较强非线性映射能力,该算法用作数据分类、特色识别上较多。
自编码器是一种非监督学习算法,由编码器和解码器组成,在编码阶段将高维数据映射为低维数据,将输入旗子暗记进行编码,再经解码阶段输出数据,完成对原始旗子暗记的复现,减少数据量。紧张有栈式自编码器、降噪自编码器、稀疏自编码器等。
2012年由荷兰学者Lambin等[11]提出了影像组学的观点,其灵感来源于肿瘤的异质性。Aerts等[12]提出影像组学能够剖析肿瘤异质性,把握肿瘤关键特色,解码肿瘤表型,剖析潜在基因表达类型,影像组学可以实现影像数据与生物数据的关联。
大略来说,影像组学即采取自动化办法对传统医学影像进行深度挖掘再利用。高通量地从影像中提取并剖析大量的高等图像特色,构建出高维特色空间,再结合运用处景利用机器学习和统计学剖析筛选出最佳特色,领悟临床和基因信息构建综合模型以支持临床治疗决策。
影像组学的框架流程包括标准化影像数据采集、图像分割与重修、特色提取、特色剖析及预测模型。
只管即便选择标准化的入组数据,使数据不受采集设备、扫描参数如层厚、脉冲序列的影响。浩瀚医院的数据采集质量参差不齐,担保质量的同时较难担保大样本,以是找到的入组标准与数据量的平衡点至关主要。
精确的图像分割是影像组学剖析的根本,目前并无统一的分割标准。人工手动分割由于精确度高仍作为金标准,但是效率低,比较较于半自动化分割,手动分割还具有可重复性差的缺陷;自动化分割虽没有规范标准,也难以在磨玻璃密度结节或者部分实性结节中担保精确性和鲁棒性,但较为迎合大数据趋势,对付实性结节分割效果也较精准。目前急迫须要联合工科发展高精度、全自动的分割算法。
影像组学特色很丰富,定量特色提取是关键步骤,目前最常用的方法是主身分剖析,常日通过无监督学习得到如直方图强度、形状特色、纹理特色犹如质性或异质性、小波特色等。
建模应考虑3个方面的成分:特色的选择、建模的方法、模型的验证。为了避免模型所含特色过多导致的过拟合问题,应对特色降维,筛选稳定性好、可重复性高的数据,影像组学以外的特色例如临床信息、疗效评估、基因信息也该当纳入以实现模型的整体性;建模方法应遵照稳定和能够办理干系临床问题的原则;模型的性能是通过不断验证来校准的,可以根据受试者事情特色(receiver operating characteristic,ROC)曲线或者ROC曲线下面积(area under the curve,AUC)验证。
王晶晶等[14]创造用支持向量机预测模型预测了由Curvelet变换提取的73个纹理特色,结果显示其敏感度为88.6%,符合率为78%,能在一定程度上降落肺癌早期诊断的误诊率。Gao等[15]将肺结节中的三维纹理特色、临床信息及CT图像数据计入支持向量机模型进行肺癌预测,可将放射科医师诊断的敏感度提高23%,特异度提高28%。
深度学习的算法可以快速调度,提高了准确度,改进了传统机器学习受手工预处理标记特色的限定以及手工分割的丈量偏差。Hua等[16]首次将深度学习技能运用于肺结节分类,利用来自肺部影像数据库和图像数据库资源的1 010例患者CT图像中2 545个肺结节,特殊先容了深度信念网络和卷积神经网络2种模型,终极敏感度为73.3%,特异度为78.7%。Lyu和Ling[17]提出由3个卷积神经网络组成的多层卷积神经网络来提取多尺度特色对良性、恶性和不愿定性肺结节分类,在不添加任何手动预处理算法的情形下,该模型的准确率达到了84.81%。Shaffie等[18]利用新的吉布斯马尔可夫随机场模型提取了来自肺部影像数据库和图像数据库资源中467例患者的727个肺结节外不雅观和几何特色,将其利用到深度自编码器进行肺结节良恶性分类,准确率达到91.20%,其局限性为无法区分良恶性结节的详细病理类型。宋尚玲等[19]提出一种基于深度信念网络的模型用于肺结节的检出,深度信念网络识别肺结节的准确率为90%,假阳性率为0.5%。
影像组学在肺结节良恶性鉴别上也有很广泛的运用。Beig等[20]网络了290例肺结节患者肺CT平扫检讨影像并提取特色,将145例特色信息用于演习机器学习分级器,并结合影像组学特色得到的AUC为0.8,较卷积神经网络和医师AUC有明显上风来区分非小细胞肺癌和良性肉芽肿。
Zhu等[21]利用LASSO logistic回归模型从129例图像中选取5个放射性标记的关键特色来构建区分鳞状细胞癌和肺腺癌的模型,验证集的敏感度达82.8%,特异度为90%,为今后详细分类病理亚型奠定了根本。Haga等[22]评估了放射组学在早期非小细胞肺癌的组织学中的浸染,AUC为(0.725±0.070),较高的预测精度意味着放射组学的无创组织学评价病理分型是一种有出息的评价方法。She等[23]提取60个放射学特色建立模型来鉴别惰性癌如原位癌、微浸润癌与侵袭性腺癌,其AUC为0.89,提示影像组学对肿瘤侵袭性的预测具有良好的运用代价。
Jia等[24]建立了一种放射组学特色和随机森林模型结合的算法识别肺腺癌的表皮成长因子受体(epidermal growth factor receptor,EGFR)基因突变,94个放射组学特色的随机森林模型的AUC达到0.802,结合临床病史后,AUC增加到0.828,表明影像组学可以识别肿瘤的基因突变。Xiong等[25]利用三维卷积神经网络来识别肺腺癌患者CT图像中的EGFR基因突变状态,卷积神经网络在独立验证集中的AUC为0.776,与临床特色(性别、吸烟史)结合后的AUC为0.838,表明深度学习也可以识别肺腺癌的EGFR基因突变,与临床特色结合预测效能更好。
虽然人工智能在肺结节良恶性诊断方面已经有了很大的造诣,但还存在很多问题亟待办理,这须要临床医师和工科技能职员的共同努力,实现人工智能技能的更好的医工交叉。临床医师不仅要提出临床问题、供应影像数据,还要熟习人工智能技能的每个流程、每个参数,这样才能自主调度模型诊断繁芜临床问题;工科职员也要深入临床,推进工科技能的临床化,真正理解临床医师和影像科医师所面临的亟需办理的问题,开拓模型新功能、优化现有模型,做到源于临床而高于临床,能为医师所用。
目前亟待办理的问题是创立数据资源共享平台,整合多中央、多参数、多模态、多病种标准化的大数据供科学研究。数据量是最根本的,还要具备标准化及多样性,包括病理信息、基因信息、治疗疗效信息、预后信息、随访信息等多层次资料,增加信息的可重复性和算法的多样性。目前已经有不同的国际组织建立了各自的公共数据库,个中CT影像的公共数据库有肺部影像数据库和图像数据库、ELCAP数据库、ANODE09数据库。
人工智能对肺结节良恶性诊断的敏感度较高,随之而来的问题是假阳性率亦高,这须要工科技能职员及临床医师对二者剖析要兼顾,优化算法,在确保一定敏感度的条件低落低假阳性率。da Silva等[29]提出了一种基于卷积神经网络的肺结节粒子群算法来降落肺结节检出的假阳性率,在肺部图像影像数据库的CT扫描中测试了该方法,得到的最高准确度为97.62%,敏感度为92.20%,特异度为98.64%,ROC曲线的AUC为0.955;结果表明粒子群算法在识别最佳卷积神经网络超参数方面有很高的性能潜力,在降落假阳性率的同时担保了高敏感度。
目前人工智能领域尚缺少临床干系性的标准化评估,亟需一套统一的质控标准,以掌握干系研究的可靠性。Lambin等[30]在2017年提出了影像组学领域的质量评分,其他的技能领域质控标准还有待制订履行。
人工智能技能走向临床须要全天下多中央、前瞻性的研究,整合影像组学与其他组学也是一大热潮。2017年Lambin等[30]再次提出应将影像组学与其他组学密切结合,如临床特色、免疫组织化学、基因组学等数据,全方面评估,有利于实现精准医疗。
目前研究较多的是整合影像与基因组学的研究,蛋白质、组织微环境、基因的改变都可以在宏不雅观影像学上有特色性的表现,乃至这种分子水平的变革早于宏不雅观变革几个月,于是衍生出影像基因组学。研究特定的影像组学特色与特定基因表达之间的潜在关系,将病理生理改变定位到基因层面,为构建影像基因组学模式奠定根本。
近年来,表不雅观遗传学、液体活检等新技能在肺癌早期诊断上的运用为亚临床期的肺癌个体化筛查供应了技能根本,干系的临床研究也正在进行。在中国临床试验注册中央中,检索到一项正在开展的肺结节良恶性赞助诊断中国多中央临床试验(ChiCTR1900026233),拟入组1 400例经影像学手段检出肺结节的患者,磋商循环染色体非常细胞联合影像学人工智能剖析工具对早期肺癌的诊断代价。期待更多大样本、高质量的临床试验为新型肿瘤标志物及人工智能工具的临床代价供应更有力的证据。
考虑人工智能联合液体活检对肺结节良恶性赞助诊断浸染目前处于临床研究阶段,故暂时不作为常规推举的肺癌筛查手段。但相信未来几年内可以看到经大规模临床试验验证的肺癌特异性生物标志物运用于临床。
规范化诊治和长期有效管理肺结节及肺癌患者能够有效提高患者生存率。为理解决部分患者难以长期规范化管理诊疗的问题,物联网医学[31]应运而生,极大改进了全国各地区尤其偏远地区的肺结节诊治水平。物联网医学具备全面感知、可靠传输和智能处理等多种功能,有利于全面理解患者的病情变革,实现对高危人群在线随访、教诲、疗效不雅观察、防止肺癌术后复发转移等;对付疑难病例又不便于就诊者,也可以联合云中专家多学科会诊和随访。
综上所述,人工智能很大程度长进步了肺结节的检出效率及良恶性的诊断鉴别能力,虽然人工智能无法取代医师的决策地位,但会成为医师的得力助手,医师也应利用好新科技带来的技能改造,同时成为科技时期的影像信息学专家。无论何种人工智能,都有其自身的优点与局限性,这里引用Yoshua Bengio的一段话:科学不是竞争而是互助,任何学科的发展都须要行业之间相互借鉴、博采众长,站在巨人的肩膀上不断前行,这样才会引发科学原有的活力。人工智能实现肺结节精准诊断的道路尚需探索和打破,相信在不久的将来,人工智能会在精准医疗时期有出彩的表现。
利益冲突 所有作者均声明不存在利益冲突
参考文献 略
本文系作者个人观点,不代表本站立场,转载请注明出处!