论文部分内容阅读
糖尿病视网膜病变(Diabetic Retinopathy,DR)是成年人最主要的致盲原因。当前阶段,DR一般是通过眼科医生观察视网膜上异常病灶进行诊断。但是,DR病变情况复杂,各种病变差别很大,而且病变程度不一,导致眼科医生诊断困难。而利用计算机视觉技术可以辅助眼科医生实现诊断,不仅能提高诊断效率,还能增加诊断的准确率。本文主要运用卷积神经网络(Convolutional Neural Network,CNN)对眼底图像进行分割。针对眼底图像数据集小的问题,提出了两个解决方案:1.用熵采样方法有效提取图像块(patch),设计基于patch的全卷积网络。通过熵采样可以剔除大量不包含有效信息的patch,大大减少运算量,同时充分利用了相邻像素的信息,可以提高分割性能。为了解决类别不平衡问题,使用加权交叉熵作为损失函数(loss)。2.通过数据增强扩充数据集,使用扩充后的数据集训练全卷积网络(Fully Convolutional Network,FCN)实现图像分割。标准U-Net使用长跳跃连接实现特征的有效传递,使分割效果更好,而残差网络(Res Net)的捷径和密集网络(Dense Net)的密集连接都是短跳跃连接,通过短跳跃连接增强梯度在局部范围内流动,使网络训练更容易。为了充分利用长短跳跃连接的优势,我们将残差结构和密集结构引入标准U-Net,分别叫做残差U-Net和密集U-Net,并使用扩展Dice分数作为损失函数。本文对眼底图像的分割包括血管分割、视盘分割、渗出物分割和出血分割四部分。我们使用基于patch的全卷积网络分割血管,分割结果在像素级别达到78.11%敏感性(Sensitivity),98.39%特异性(Specificity),95.60%准确率(Accucary),87.36%精确率(Precision)以及97.92%AUC分数(AUC),取得了很好的实验效果。同时使用残差U-Net和密集U-Net分割视盘、渗出物和出血,也都取得了很好的实验效果。本文提出的分割算法已在上海市第一人民医院测试。最后,论文对部分特征图(feature map)进行了可视化分析,发现最开始的卷积层主要用于提取包括线、角、边缘等底层特征,随着网络的加深,卷积层主要提取高级语义特征,几乎看不到细节信息。在分割问题中,需要上采样恢复尺寸,可以发现上采样过程中细节信息逐层恢复,细节信息越来越丰富。另一方面,通过特征图可视化,可以发现潜在的干扰,为后续改进提供思路。