论文部分内容阅读
肺癌是当今世界危害性最高、死亡率最高、最难被治愈的重大疾病之一,比其他恶性肿瘤更让人恐惧的是一般发现得病即已是晚期。早期发现肺癌存在较高难度,如果肺癌患者在处于早期阶段即被确诊并进行相关诊疗,那么5年存活率将得到极大提升。阅读大量患者的肺部CT图像对医生而言是一个高强度高耗时的工作,医生在阅片过程中疲劳感增强进而导致阅读图像的效率和质量下降,从而产生的误诊漏诊现象也会不断发生,这也是造成肺癌死亡率近年来位居前列的重要原因之一。计算机辅助诊断系统可以通过相关算法对肺部CT图像进行分类检测,减轻医生的工作负担的同时为肺癌的早期防治与监控提供了有力保障。传统检测方法存在需要精确分割肺结节和人工提取图像特征的弊端,利用卷积神经网络进行肺结节检测已开始普及,但是目前的检测模型多为单输入单通道的网络结构,无论网络结构多复杂层数多深只能针对某一种尺度的肺结节进行特征提取,而现实情况是肺结节本身大小各一,且作为负样本的非肺结节也在尺度上无法统一,这给单通道的网络带来极大挑战,从而影响检测准确率的进一步提升。而且,目前存在部分网络为了挖掘更多的信息会设计十分复杂的结构,在实际运行时会遇到计算瓶颈和过拟合现象,占用大量资源的同时也会影响检测效率。本文针对以上弊端,重点对于多尺度输入的集成卷积神经网络肺结节检测方法进行了深入研究。具体工作包括以下几个方面:(1)提出了一种基于XML注释文件实现对肺部感兴趣区域精确提取的方法。本文在 LIDC-IDRI(The Lung database Consortium and Image database resource Initiative)公开数据库上利用XML文件中专家的标注信息对肺结节和非肺结节进行准确提取,并通过归一化处理和数据增强构建了正负样本平衡的样本库。(2)针对传统机器学习算法识别肺结节的弊端,引入深度学习思想,搭建了卷积神经网络模型用于肺结节的分类识别,通过实验确定了Dropout比例、全连接层特征图数量、激活函数选择等重要网络参数,该算法区别于传统机器学习算法最大的优点在于模型可以自动提取图像深层特征,分类结果更加客观真实。(3)针对目前卷积神经网络单输入单通道带来的性能不足问题,引入多尺度输入方法和集成学习思想,提出了一种基于多尺度输入的集成卷积神经网络检测算法。图片输入由单输入变为多输入,网络通道由单通道变为三通道,将三个结构逐渐加深的网络的输出层融合到一起,通过投票法的的结合策略将弱分类器的结果集成得到强分类器,这样的网络结构比输入单一尺度的图片能够学习到更多肺结节的特征信息,从而提升检测性能。本文在LIDC-IDRI数据库上进行实验,识别准确率为93.0%、灵敏度为93.3%、特异度为92.7%,与当前最新的肺结节分类算法相比具有一定优势。本文将卷积神经网络模型、多尺度输入理念和集成学习思想引入肺结节检测识别实验当中,结果表明本文提出的算法能够在一定程度上帮助医生进行肺结节诊断,为肺癌的“早发现,早干预,早治疗”提供技术保障。