论文部分内容阅读
宫颈癌是最常见和最危险的疾病之一,研究宫颈全玻片图像识别对提高宫颈癌细胞学筛查的准确率十分重要。由于全玻片图像十亿量级的像素量和感兴趣细胞的易混淆形状,相关方法在进行宫颈全玻片的图像分类及腺细胞检测时仍然耗时长、假阳性严重。因此,全玻片图像识别方法的效率和可靠性问题亟待解决。虽然现有的深度学习方法表现出了超越病理学家的潜力,但相关工作仍然使用针对日常图像的通用深度学习模型及其设计思路,在面对具有复杂特性的宫颈细胞学图像时仍有提升空间。针对上述挑战,本文提出了基于深度学习的高效宫颈全玻片图像识别方法。(1)针对深度学习模型在计算全玻片图像时的效率问题,本文提出了一种基于语义和形状特征的高效全玻片图像分类框架。该框架设计了一个超轻的宫颈病变细胞检测模型来同时提取语义和形状特征。它通过利用细胞学尺度较为单一的特点,为浅层网络添加了内部链接,使其在保持高效的同时,具备优秀的局部细胞特征表征能力。对于浅层、轻量模型在大数据上的训练问题,本文还设计了一种假阳性自动挖掘功能,使得轻量模型同样可以获得充分的训练。实验结果表明提出的浅层、轻量模型在宫颈全玻片图像分类任务拥有优越的精度和性能,相较比它34.4倍大的深层、通用模型YOLOv3在分类指标中提升了0.5%,且对每张玻片的实际运行耗时在单GPU条件下可以快至55.9 s,这已经超过了3DHistech扫描仪的数据获取速度。(2)针对全玻片图像宫颈腺细胞检测的假阳性问题,本文提出了一种极性注意力网络来量化腺细胞中的易混淆形态。该网络采用了一种新颖的八邻域自注意力机制,使其可以为腺细胞极性方向的显著性打分。通过这样的极性分数抑制在外部玻片中极性不显著的假腺细胞。该网络是一个深度学习模块,可以被插入到任意通用的目标检测模型来生成极性分数和极性注意力引导的特征图。在局部测试图像和外部全玻片测试图像的腺细胞检测实验中,极性注意力网络均表现出了有效性,且相较通用模型Faster RCNN,部署后的应用程序在牺牲14.4 s计算耗时的前提下提升了8.8%的全玻片腺细胞Top-20检测精准度。如上所述,本文提出了两个宫颈细胞学全玻片图像识别模型,分别提高了全玻片图像分类的效率和全玻片宫颈腺细胞检测的可靠性。经过C++模块化应用程序的部署后,进一步地展现了这两个模型的有效性和实际应用价值。