肺结节良恶性分类的深度学习融合算法研究

来源 :中国人民解放军陆军军医大学 | 被引量 : 2次 | 上传用户:jenny_408
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究背景:肺癌是全世界癌症相关死亡的最主要原因。肺癌由于其无症状生长的特性,导致肺癌患者往往在晚期才被诊断。流行病学调查研究显示,早期肺癌患者的5年生存率可达56%,而晚期肺癌的5年生存率仅有5%,因此肺癌的早期筛查是提高肺癌患者生存时间的关键手段;而相关研究显示,低剂量CT筛查可以使肺癌高危患者的死亡率降低14-20%。由于放射科医师的相对匮乏,临床上大量的影像资料严重增加了放射科医师的负担,且在长时间、高强度阅片的情况下容易出现判读不准确、不稳定等问题。因此人们开始诉诸于计算机辅助诊断系统,希望借此减少放射科医师负担、提高临床诊断效率。计算机辅助诊断的发展主要经历了两个阶段,第一阶段主要是基于以图像特征为输入的机器学习方法发展阶段(又称为影像组学),第二阶段主要是基于以图像直接作为输入的深度学习方法发展阶段。存在的问题和研究目的:近年来深度学习的崛起,为计算机辅助诊断领域带来了新的机遇,但同时深度学习方法在医学影像中的应用作为一门新兴学科,其发展仍然处于起始阶段,当中还存在一些亟待解决的问题:一方面,当前的诸多算法几乎只利用患者的非结构化数据进行分析,如CT、MRI、X片等,而忽略患者的一些结构化数据,如临床基线数据、疾病史、遗传史、化验检查等,但是这些数据都是对一个患者病情做出准确判断的重要依据,因此如何整合患者的多模态数据来对疾病做出诊断将是一个我们需要探索的问题;另一方面,深度学习方法是一种可以自动提取图像特征、并进行自我学习的算法,因此人们将主要精力都放在了深度学习模型的改进和改造上,而忽略了特征工程对模型性能的影响,尤其在医学影像领域,病灶周围的组织会对模型产生极大的干扰,因此如何设计良好的特征,减少这些干扰对模型的影响是另一个待解决的问题。为此,针对目前存在的问题,论文展开了两方面的研究,一是构建融合模型,试图将患者结构化和非结构化数据整合以提高肺结节的分类表现;二是探讨不同尺度和不同模式的肺结节图像对深度学习模型分类效果的影响,并探索一种新的肺结节图像模式的可行性。研究内容和结果:论文针对当前深度学习方法在肺结节计算机辅助诊断中存在的问题展开了如下研究:(1)针对当前算法不能充分利用患者信息的问题,提出了SUDFNN和SUDFX两种融合算法,该算法能够将患者的结构化数据和非结构化数据进行联合建模,通过从多模态数据中挖掘有效信息来对疾病做出更全面的诊断。利用肺癌数据集LIDC-IDRI标注文件中的结构化数据,以及LUNA16数据集中的CT图像数据,我们提取了684个肺结节的3D图像及其相应的9个结构化特征。实验结果表明,和仅利用图像数据的算法比较,结构化特征的加入能显著提升肺结节的分类表现,模型的综合指标最佳可以达到:准确率92.6%,敏感性91.9%,特异性93.4%,ROC曲线下面积0.971。(2)针对当前深度学习的特征工程问题,探究了不同尺度及不同模式肺结节图像对模型分类表现的影响,并提出了一种2D多视图融合(2D MVF)的肺结节图像处理方法。该方法比传统的2D方式能获取更多的肺结节信息,同时又能比3D的方式引入更少的干扰组织。为了验证模型,对LIDC-IDRI和LUNA16数据集进行了预处理,得到了16、25、36三种尺度下2D、3D、2D全视图融合(2D FVF)以及2D多视图融合(2D MVF)4种不同模式的肺结节图像,然后构建了2D CNN、3D CNN、2D全视图融合卷积神经网络(2D FVF-CNN)、2D多视图融合卷积神经网络(2D MVF-CNN)四种模型。利用上述样本对模型进行训练和验证,最终结果表明,2D多视图融合模式下的肺结节图像相对于其他模式图像具有更佳的肺结节分类表现,其中最佳准确性达到92.8%,敏感性91.3%,特异性93.6%,ROC曲线下面积0.963;对比多种尺度图像,小尺度下的分类表现相对更佳。研究结论和意义:(1)相对于仅利用图像数据的模型,结构化数据的引入可以提升分类表现;(2)结构化数据可以捕捉肺结节之间多方面异质性来对结节进行鉴别;(3)深度学习模型的特征工程对其分类效果有较大影响,其中2D多视图融合图像在获取较多的肺结节信息的同时引入更少的干扰性组织,能显著提升模型分类表现。论文提出的SUDFNN和SUDFX两种融合模型算法可以对结构化数据和非结构化数据进行有效地联合建模,以及探讨了不同尺度及不同模式肺结节图像特征工程对模型分类表现的影响、并据此提出了2D多视图融合的肺结节图像处理模式,均可以提高肺结节的分类性能、且具有良好的扩展性。这些融合模型算法及融合图像模式不仅丰富和拓展了深度学习等方法理论及其应用研究的内容和思路,而且为后续医疗大数据分析方法体系构建奠定了良好的基础,具有重要的学术理论意义和潜在的应用价值。
其他文献
伴随着人类社会的快速进步和发展,人与人之间的信息交流也变得越来越重要,故而信息的传递效率越来越成为人们在乎的重点。在数据通信系统中,分为并行通信和串行通信两种,具体
随着科学技术的不断发展,大跨空间结构的应用日益广泛,其健康监测也被越来越多的人关注。在结构长期的使用过程中,必然会因为各种原因造成不同的损伤,如果发现或处理不及时,
目的:研究激肽释放酶-激肽系统及炎症因子在ED大鼠模型阴茎组织中的表达变化,探讨其在ED发生发展过程中可能发挥的机制与生物学意义。方法:取120只性功能正常SD雄性大鼠,随机
因为斜齿轮具备噪声低以及载荷平稳等方面的优势特征,所以目前已经被普遍应用到了生产生活的多个领域当中。根据国外相关研究结果显示,在精密斜齿轮齿面即使是出现微米级形状
当今物流仓储行业快速发展,AGV作为一种智能设备逐步应用于仓储搬运作业。相比人工搬运,AGV的使用可以提升搬运效率,但随着搬运任务的急剧增长,以蓄电池作为电能供应的传统AGV作业时长短、维护费用高的缺点暴露无遗,难以满足现代化仓储的需求。为克服蓄电池的固有缺陷给AGV的续航时间带来的使用弊端,在阅读文献和进入AGV设计制造企业实习的基础上,总结AGV的应用现状,设计一款啮合驱动式搬运AGV。本课题
页岩气是目前世界非常规油气勘探开发的新领域,已经引起了全世界范围的广泛关注。目前美国是世界上唯一一个实现页岩气大规模商业性开采的国家,其页岩气勘探开发技术正处于快
大肠埃希菌在兽医临床上可引起多种疾病,近年来愈来愈严重的耐药性问题对畜牧业以及人类的健康都有着很大的威胁,从传统中药中寻找新的抗菌药物或耐药性抑制剂受到了广泛关注。地榆为蔷薇科植物地榆Sanguisorba officinalis L.或长叶地榆Sanguisorba officinalis L.Longifolia(Bert.)Yüet Li的干燥根,味苦、酸、涩,性微寒,归肝、大肠经,具有凉血
太极拳被认为是道家之动功,被称为哲学拳术,从太极拳的起源、发展过程、太极拳门派、拳架内涵、特征和理论依据等来看,太极拳深受道家思想的影响;建国后,太极拳虽得到空前发
当今世界,经济全球化、政治多元化、社会信息化的浪潮不断推进,各个国家和地区之间的联系越来越紧密,整个世界格局呈现出互相依赖、共存共生的状态。新的历史发展时期,以计算机和网络技术为代表的新科技革命发展迅猛,各个国家的生产力有了很大发展,世界多极化趋势日益凸显。全球范围内的生产力进步带来了国家间竞争的深入,国家之间的竞争覆盖经济、社会、政治、生态、文化等多个方面,而科学技术和创新能力也逐步成为国家发展
超级电容器是在近代能源危机和环境问题日益加剧的大背景下诞生的一种新型储能器件,其电容值远超普通电容器,具有高循环寿命,高功率密度,支持高速充放电等优点,多孔碳是超级电容器最常用的一种电极材料。本论文通过调节活化方式和孔结构,制备了具有高比电容值和循环稳定性的多级孔结构碳电极材料,并对活化原理,活化过程和影响材料电容性能的因素进行了深入研究。1,以乌拉草为原料,对其进行炭化并使用氢氟酸溶液进行超声清