论文部分内容阅读
内窥镜检查是临床上检查消化道病变最基础和最直接的手段。然而由内窥镜采集到的消化道图像包含大量的干扰因素,例如镜面反射、运动模糊、气泡等,这些干扰因素的存在十分不利于医生的诊断和治疗。此外,在开发消化内镜图像数据帧的质量评估算法时,图像中存在的干扰也是重点考虑的对象。因此,发展消化道内镜图像干扰的检测方法,对于发展可靠的消化道病变计算机辅助诊断工具、自动图像质量评估算法以及提升实际诊疗效果十分重要。在消化道病变的人工诊断方面,内镜图像庞大的数据量以及病变外观的多样性等因素增加了医生诊断的难度,容易导致漏诊和误诊。因此,发展消化道病变区域自动分割算法,能够帮助减轻医生负担,可在一定程度上辅助医生的诊断和治疗,有助于降低漏诊和误诊率,具有重要的实际意义。为此,本文对消化道内镜图像的干扰检测与病变分割方法进行了研究。主要研究内容如下:(1)基于深度学习的消化道内镜图像干扰检测方法研究发展了基于级联区域卷积神经网络(Cascade Regions with Convolution Neural Network,Cascade RCNN)的目标检测网络,运用级联目标检测器实现对多尺度目标的检测。首先将基础网络Resnet 50与用于提取多尺度特征的特征金字塔网络结合,增强特征提取能力并提取更丰富的图像信息。然后用级联的目标检测网络Cascade RCNN对运动模糊、气泡、镜面反射、像素过饱和、低对比度、医疗设备和其他干扰共七类干扰进行检测。为了克服多个干扰相邻和重叠问题,改用软非极大值抑制算法,调整检测框的筛选策略。此外,使用focal损失函数,克服类别分布不均衡问题,同时对难易分类样本施加不同的惩罚。该检测方法在2347张内镜图像组成的数据集上进行了五折交叉验证,得到了0.5412的平均精确率均值(mean Average Precision,mAP)和0.4675的交并比(Intersection over Union,IoU)。与其他方法相比,该方法具有更好的检测性能。(2)基于深度学习的食管早癌病变区域分割方法研究受Deeplabv3+网络的编码-解码框架启发,提出了一种新的辅助食管早癌诊断的FC-DeepLab网络。编码器的基础网络是Deeplabv3+的基础网络的简化,并且加入了全连接注意力模块,再利用带孔空间金字塔池化,以不同的扩张率来进一步提取和整合特征。解码器利用双线性插值恢复图像分辨率,进行像素级的分类,得到分割结果。此外,将激活函数改为PReLU,能够激活输入为负的神经元。实验表明,本文所提方法对食管早癌分割的性能有一定的提升。损失函数使用focal tversky函数,该损失函数能够在精确率和召回率间达到更好的均衡,降低漏检率。在3190张临床胃镜图像上的性能评估表明,本文所提方法的精确率、召回率和Dice系数分别为0.7610、0.7814和0.7711,达到了预期的效果。