论文部分内容阅读
宫颈癌是导致女性死亡的第二大恶性肿瘤,大约占总的癌症死亡率的十分之一。据WHO统计,2015年全球有51.8万新增病例和27.3万死亡病例。2015年,我国有9.89万新增病例和3.05万死亡病例;而美国仅有1.29万新增病例和0.41万死亡病例。预计到2050年,我国将会有18.7万新增病例。因此,寻找适合于我国的宫颈癌的筛查方法已经迫在眉睫。宫颈细胞图像识别技术是近年来兴起的一种新的宫颈细胞识别的方法。该方法克服了传统的人工判读筛查方式存在成本高、工作量大、可靠性与准确性受到医师专业技术和主观情绪的影响等问题。该方法首先采用液基薄层制片技术将脱落细胞制片,然后在显微镜视野下通过工业相机抓取细胞图像进行分析识别。不仅能够用于检测异常上皮细胞,而且能够应用于宫颈癌的筛查诊断。本文采用宫颈细胞图像识别技术辅助病理学医生诊断,最终目的是识别出宫颈内异常上皮细胞,减轻医生的工作量、降低诊断结果中的假阴性和假阳性。宫颈细胞图像识别方法主要包括宫颈细胞图像获取、宫颈细胞图像预处理及分割、宫颈细胞图像特征提取和宫颈细胞图像分类四个阶段。本文对宫颈细胞图像识别方法以下几个方面进行改进:在宫颈细胞图像类别划分方面:本文结合宫颈取材特点,提出了两种划分方法。第一种类别划分方法,首先将宫颈细胞图像分为上皮细胞、淋巴细胞、中性粒细胞和垃圾细胞,然后将上皮细胞分为正常上皮细胞和异常上皮细胞,并将该宫颈细胞图像划分方法应用于SMMCFBCCI分类器。第二种类别划分方法,将宫颈细胞图像直接划分为正常上皮细胞、异常上皮细胞、中性粒细胞、淋巴细胞和垃圾细胞,并将该宫颈细胞图像类别划分方法应用于PMMCFBCCI分类器。在宫颈细胞图像特征选取方面:本文结合了前人研究和宫颈细胞学特点,提出了NF和PF特征集合。其中,NF是根据宫颈细胞病理特征定义的常规特征集合,共22维;PF是指传统方法中没有考虑到的潜在特征集合,共14维。然后,采用Relief F算法选择出类别相关性高的24维特征。在宫颈细胞图像分类器设计方面:结合多分类器融合方法,本文提出了SMMCFBCCI分类器和PMMCFBCCI分类器。SMMCFBCCI分类器是基于两级级联的多分类器融合方法。其中,第一级粗分类采用C4.5分类器;第二级细分类采用LR分类器。PMMCFBCCI分类器是基于多数投票法的串行分类器融合。首先,采用NB、C4.5及KNN分类器得到预测结果;然后,采用多数投票法得到最终预测结果。