论文部分内容阅读
癌症是全世界难以完全根治的顽固疾病,每天都有患者被医生诊断为癌症。在欧洲和美国等国家,因癌症而导致死者的人数的趋势是下降的;但在包括亚洲在内的其他地区却在增加尤其是胃癌和肝癌的患病比例较高。肺癌的死亡率和发病率居于第一位,胃癌次之。胃癌病理切片图像识别和分割癌变区域是胃癌辅助诊断重要的手段。现有的基于Resnet的识别模型是基于自然图像数据集提出的,并且可以使用海量的自然图像样本进行训练。然而对于胃癌病理切片图像的识别,基础Resnet模型构建没有考虑到医生诊断的方式,并且医学数据集不可能达到如Imagenet数据集一样的规模。所以,本文基于胃癌病理切片图像在不同放大倍数采集以及医生的诊断习惯,考虑到胃癌切片图像数据集规模较小的特点,提出了一种基于Resnet的胃癌病理切片图像识别模型。基于医疗图像提出的监督学习分割模型如U-Net,在医疗图像的分割上有不错的表现。但是对于本文中使用的部分标注癌变区域的胃癌病理切片图像数据集,因为存在未标注的癌变区域,并且未标注区域信噪比较低,使用部分标注的胃癌病理切片图像数据集直接训练分割模型,模型性能较差。现有的基于自然图像提出半监督分割模型,都集中于训练复杂的辅助分支。本文设计了三种以Resnet作为编码器的分割网络,并且提出了基于self-training的半监督癌变区域分割算法,不需要添加复杂的辅助分支。在胃癌病理切片图像识别任务中,本文提出了一种基于Resnet的识别网络结构。基于病理图像的成像方式和医生的阅片方式,本文设计了多尺度输入的Resnet。本文使用的胃癌病理切片图像数据集规模较小,这符合现实世界中医学数据集标注困难,导致规模较小的特点。所以,本文在Resnet中的全局池化层之后,引入了dropout结构,在损失计算时引入L2正则项,抑制小规模数据集训练引起的过拟合现象。在胃癌癌变区域分割任务中,本文提出了基于Resnet的半监督癌变区域分割模型。本文使用Resnet作为编码器,分别使用U-Net的解码器、FPN和本文提出的DFP模块构建了三种分割模型。在实验中,针对专业医生标注癌变区域与背景接触边缘较为粗糙的问题,提出了基于颜色反卷积算法和传统图像处理分割算法的标注修正算法,经过实验发现,该算法经过修改,可以用于快速分割病理图像中的细胞核区域。针对部分标注癌变区域的数据集,本文设计了一种基于self-training算法的半监督癌变区域分割算法,提高分割模型的性能。这是self-training算法首次应用于胃癌病理切片癌变区域分割任务中。