论文部分内容阅读
宫颈癌严重危害女性健康,早期筛查可以减少因宫颈癌造成的死亡人数。宫颈癌计算机辅助筛查系统可以减少病理专家的工作量,有助于解决我国基层地区人口众多、病理专家缺乏之间的矛盾。然而现有的辅助筛查系统依赖成本高、体积大的标准显微镜,难以在基层地区应用。结合成本低、体积小的便携显微镜设计一个宫颈细胞全涂片图像分类方法有望在基层地区应用,提高基层群众的宫颈癌粗筛率。该方法面临两个问题:获取全涂片图像中细胞粒度的标注比较困难,宫颈细胞全涂片分类方法泛化性不足。本文针对这些问题开展研究,主要工作如下:(1)针对获取细胞粒度的标注困难的问题,提出了一种基于弱监督学习的宫颈细胞全涂片图像分类方法。分析了已有弱监督学习方法选择代表性区域图像代替全涂片图像的不足,提出了一种整合全涂片图像中所有区域图像的弱监督学习方法。使用Transformer结构做为特征提取器,对比学习训练特征提取器,设计了基于注意力机制的特征聚合器。本方法在宫颈细胞全涂片图像测试集上的准确率比其他弱监督学习全涂片分类方法高11.5%。(2)针对全涂片分类方法泛化性不足的问题,提出了一种基于遗传算法的数据增强搜索方法。将数据增强搜索与遗传算法绑定,结合遗传算法设计数据增强编码方式,根据遗传算法更新数据增强,使用代理分类任务的效果评估数据增强的效果。搜索数据增强能够提高全涂片分类方法的泛化性,在宫颈细胞全涂片图像两个测试集上的准确率比手工设计的数据增强分别提高了8.5%和1.4%。(3)将宫颈细胞全涂片图像分类方法应用在多来源涂片测试和典型病变区域推荐等任务上。具体应用及结果包括:在多来源三甲医院全涂片图像上的准确率可达89.6%,在基层医疗机构全涂片图像上的准确率可达65.9%,证明了本方法的有效性;在全涂片图像推荐的10个典型病变区域中平均包含2.23个阳性区域,证明了本方法可以学习到阳性细胞表征;构建了一个可视化工具用来展示全涂片图像推理过程,有望加速全涂片图像分类方法在基层地区的应用。综上所述,结合便携显微镜和宫颈细胞全涂片的特点,本文设计一个基于弱监督学习的宫颈细胞全涂片图像分类方法,旨在构造用于基层地区的宫颈癌计算机辅助筛查系统,该系统有望提高基层地区群众的宫颈癌粗筛率。