论文部分内容阅读
青光眼是一种导致视力丧失且不可逆转的慢性眼病,杯盘比在青光眼的筛查和诊断中起着重要的作用,从视网膜图像中准确的分割视盘和视杯是一项基本任务。与其它眼底疾病如白内障和近视不同,青光眼造成的视力丧失无法逆转。因此,早期筛查对于早期治疗以保持视力和维持生活质量至关重要。然而,由经过培训的临床医生对视网膜图像进行的人工评估耗时且昂贵,并且不适合人群筛查。虽然目前已有一些视盘视杯自动分割方法,但大多数现有的方法存在以下问题:特征信息提取不充分,容易受到病灶区域和低分辨率图像的影响;模型的感受野小,无法准确捕获不同大小待分割区域的全局上下文信息,造成特征信息提取不充分;部分方法依赖于手工提取视觉特征,没有考虑视盘和视杯两者的关系,造成模型分割性能差等。针对以上问题,本文提出了基于生成对抗网络的多标签深度学习模型,论文研究的主要内容如下:(1)提出了一种结合生成对抗网络的多标签深度卷积神经网络模型GL-Net(Generative Learn Networks),实现了对视盘和视杯同时进行自动分割。GL-Net由生成器和判别器两个网络结构组成。训练时,生成器和判别器进行极小极大博弈与条件约束进行优化。在损失函数中加入了L1距离函数和交叉熵函数,防止了模型训练时出现“模式崩溃”,并且使得分割结果更加的准确。减少了生成器的下采样因子从而缓解了过多的特征信息损失,并且使用跳层连接将解码层比较粗略的低级分割信息与编码层精细的外观信息相结合,使得分割图获得更加完整的上下文信息。使用数据增强的方式对训练集中的样本进行扩充,并利用深度神经网络中迁移学习有效的泛化能力,通过从相关的数据集中学习到的丰富特征信息进行转换缓解了模型在有限医疗数据集上训练存在的过拟合问题。实验结果表明GL-Net具有比其他模型更好的分割结果。(2)在GL-Net的基础上对生成器进行了改进,其中编码器部分引入了级联扩充卷积,解码器部分引入了尺度重构层进行上采样,提出了一种新的多标签深度学习模型DR-Net(Dilated Reconstruction Networks)。由于扩充卷积存在“网格化”问题,当扩充率越大时,采集到的特征信息越稀疏,捕获的特征信息之间可能无关紧要,导致模型分割的准确性降低。因此,提出了级联扩充卷积缓解这个问题,级联卷积通过N个不同扩充率的扩充卷积进行级联,不仅增大了模型的感受野,且感受野区域内的所有特征信息都能够完全覆盖,没有任何的空洞和边缘缺失。提高了模型对局部上下文信息的理解能力、保持着感受野内特征信息之间的相关性。为了提高模型的速度,解码器中使用尺度重构层的方式进行上采样,尺度重构层通过对特征图中的信息进行周期性重排,对特征图的通道数进行压缩从而扩大分辨率达到上采样的效果。尺度重构层没有增加额外的参数和计算开销,可以提高DR-Net的速度,并且尺度重构层是可以学习的,因此能够捕获和恢复下采样中损失的详细信息。实验结果表明DR-Net进一步提升了视盘和视杯分割的准确性。