论文部分内容阅读
近年来,许多国家的统计数据都显示肺癌的发病率和死亡率在不断增高,现在已位于恶性肿瘤发病率和死亡率的首位。肺结节是肺癌最重要的早期征象之一,根据肺结节的病变特征能推断出肺部病灶的病变性质,帮助患者预后。所以,对肺部疾病患者进行及早的肺结节检测和治疗是降低肺癌死亡率的关键措施。肺癌诊断的最佳方法是CT断层扫描,但对医生而言,从大量的CT图像中将肺结节甄别出来是一项繁重的工作,并且存在主观性,容易造成误诊和漏诊。目前,通过计算机辅助诊断(Computer-Aided Diagnosis,CAD)系统对患者的肺部CT影像进行初步的肺结节分析和识别,能为医生提供有用的参考信息,辅助医生及时地对肺部疾病患者做出准确的诊断。因此,CAD技术在肺癌的准确检测与诊断方面的研究工作变得尤为重要,本课题也正是基于这一目的,针对肺癌计算机辅助诊断技术中特征提取和分类识别这两个重要环节开展相应的研究。肺癌CAD系统的主要工作流程包括:肺结节分割、肺结节的特征提取和肺结节的分类识别,其中研究的主要内容涉及数字图像处理、统计学和机器学习等多个领域。由于肺结节的分割技术已相对成熟,本论文使用现有精确度较高的FRFCM(Fast Anti-noise FCM)聚类分割方法对肺部CT图像进行分割。本论文的主要工作包括以下两个方面:(1)在特征提取环节,本论文通过对肺结节的形态学特征、密度、边界、位置以及空间信息等五个方面的医学病理特征和图像信息进行全面的分析学习,以LIDC(Lung Image Database Consortium)数据库中医学专家对肺结节的标注信息为依据,提出了一组以形状特征为主、涵盖灰度特征和纹理特征,能够较全面表征肺结节的特征向量。(2)肺结节的分类识别是肺癌CAD系统的关键环节,本论文通过分析论证现有肺结节分类识别方法的局限性,提出利用半监督模糊C均值聚类的思想对肺结节进行分类识别,并且针对传统的半监督模糊C均值聚类算法在此类应用方面的不足进行改进。改进的FCM算法在引入部分标记样本作为监督信息的同时,根据标记样本的类别信息计算得到一个参考隶属度,然后利用参考隶属度进一步指导无标记样本的聚类过程。实验结果表明,本论文提出的改进算法最终得到分类识别的平均准确率达到了77.6%,其中对恶性结节的识别准确率达到91.3%,相比常用的肺结节分类识别的方法均有大幅度的提高。