论文部分内容阅读
肺癌是第二大癌症,世界上大约14%的患癌的人都是肺癌。多数病人得不到医治的原因是没有在疾病早期进行成功检测,从而发现肺癌的时候已经到达了疾病的晚期,因而失去了最佳的治疗时机。如果病人能够提在早期检测出肺癌,那么对于病人后续的治疗帮助是极大的,病人的生存几率也大大增加。因此,肺癌的检测开始逐渐受到关注。目前医学上可以对病人的肺部进行CT(computed tomography)扫描,从而得到CT片,医生通过CT片中的结节的形态来判断是良性结节还是恶性结节,从而判断是否患有肺癌。但是这个过程完全取决于医生的经验,不同的医生对同一张CT片可能会给出不同的结果,有的时候甚至还会发生漏检的情况,从而对肺癌病人的治疗产生不利。在计算机科学领域,如何通过建立模型,对肺部扫描的CT片进行处理,然后进行自动的肺癌检测,并且对这些结节进行分析确定病人患病的几率已经成为机器视觉的一个重要的课题。不同于二维图像的分类,分割,目标识别等任务,肺癌检测存在以下挑战:首先,医疗图像数据量相对于二维图像分类来说是非常少的,比如对于ILSVRC(Large Scale Visual Recognition Challenge)图像分类任务来说,训练数据有百万张,而对于肺癌检测的数据集LIDC-IDRI来说,一共收录了1018名肺癌患者的数据,相对来说,数据量很少。再者,不同于二维图像,肺部的CT片的形成是对肺部不同的断层位置进行扫描,每个断层是一个二维图像,所有的断层组成一个完整的三维的CT图片,因而直接使用常用的二维图像的模型已经不能奏效。本文主要提出了适用于三维CT图像的肺癌检测系统,通过设计肺癌结节的检测分类模型来提升肺癌检测的精度。本文的研究内容如下:(1)对传统以及深度学习的肺癌分类检测进行综述,并简要说明过去的研究方法的优缺点。(2)针对肺癌检测数据集较少的问题,本文提出了适用于肺癌结节位置的数据处理以及增强方法。(3)为了解决二维图像模型对三维图像不适用问题,本文提出了适用于肺癌诊断的三维卷积神经网络模型。该模型包含了两个部分,第一个部分是一个三维深度结节检测网络(FCN)模型,这模型能够生成肺癌结节的热度图,通过热度图我们可以定位那些恶性结节的位置。根据第一个部分生成的热度图,第二个部分将那些可能性大的恶性结节选择出来,然后把这些选择出来的结节的特征融合成一个特征向量,这个特征代表了整个肺部扫描的情况,最后我们用这个特征进行分类,判断是否是患有肺癌。(4)最后本文在公开数据集LIDC-IDRI上进行了相关实验来证明所提出方法的有效性。