论文部分内容阅读
糖尿病是世界上最主要的慢性非传染性疾病之一。中国是糖尿病的重灾区,中国的糖尿病患者数量已高居全球首位。近年来,随着糖尿病患病率的上升,糖尿病带来的疾病负担越来越严重,糖尿病及其并发症严重影响了人类的生活质量。糖尿病性视网膜病变是糖尿病的严重并发症之一,增殖性视网膜病变甚至存在致盲风险。微动脉瘤是糖尿病性视网膜病变的最早期临床可见症状,在糖尿病性视网膜病变的初期筛查中起着重要作用。由于中国的糖尿病患者数量在不断增加,并且其中大部分生活在医疗欠发达地区,诊断率低,知晓率、治疗率和控制率均有待改善。因此,利用计算机图像处理技术实现微动脉瘤的自动检测对早期防治糖尿病性视网膜病变有着重要的意义。
本文以公开的彩色眼底图像为研究对象,结合眼部解剖结构和微动脉瘤病理特征,从原理及实现方式两个方面研究深度学习在糖尿病性视网膜病变中的微动脉瘤检测和病变识别问题,主要研究内容如下:
1、针对当前微动脉瘤检测存在的算法复杂度较高、模型参数量大以及检测运算时间过长等问题,本文提出了一种新型端到端眼底微动脉瘤检测网络。该网络将原始U-Net结构中的四个下采样步骤削减至两个,将解码部分的反卷积改为上采样和卷积,将跳层拼接连接方式改进为跳层减连接方式。所设计的网络结构具有两方面的优势:第一,跳层连接方式的改变有利于网络学习到区分度不高的小目标特征并尽可能地保留更多的疑似病灶区域;第二,通过减少原始模型中的卷积层,大大降低了模型的参数量,有利于模型的轻量化和缩短模型的推理时间。在E-Ophtha-MA数据集上的实验结果表明,所提模型将原始模型的参数量降至原来的5.41%,将1440×960尺度的眼底图像微动脉瘤检测时间降至2秒;
2、针对当前眼底微动脉瘤病灶级检测效果不佳的问题,本文提出了一种基于Dice系数的加权损失函数。在网络学习的过程中,利用损失函数降低简单样本的损失权重并增加困难样本的损失权重,可以指导网络实现更多目标区域的召回。在进一步的实验中发现,降低网络最后一层激活函数的最大斜率有利于保留网络输出的概率区分度。因此,本文提出了一种基于Sigmoid的长尾激活函数,既保留了原函数的值域归一化功能,又可以保留网络预测图像的概率区分度。在ROC数据集和E-Ophtha-MA数据集上进行的大量实验表明,所提方法使得困难区域的平均识别率提升4.79%。从绘制的FROC曲线中可以看出,所提方法在微动脉瘤检测方面的泛化能力较强,并且取得了较有竞争力的性能;
3、尽管深度学习具有快速审查大量医学影像并做出诊断的潜力,但其临床可解释性仍具挑战。本文利用公开的糖尿病眼底病灶分割数据集,按比例组成了健康的眼底图像集和包含糖尿病性视网膜病变的眼底图像集。利用ResNet-18分类网络实现了有无病变的二分类。再通过可视化正向传播时卷积核的输出和反向传播时网络中的权重系数,突出显示了图像中对分类结果比较敏感的像素区域。在合并了E-Ophtha-MA和IDRiD的组合数据集上的分类和可视化实验表明,分类网络更加注重于学习对分类结果比较敏感的病灶区域。
本文以公开的彩色眼底图像为研究对象,结合眼部解剖结构和微动脉瘤病理特征,从原理及实现方式两个方面研究深度学习在糖尿病性视网膜病变中的微动脉瘤检测和病变识别问题,主要研究内容如下:
1、针对当前微动脉瘤检测存在的算法复杂度较高、模型参数量大以及检测运算时间过长等问题,本文提出了一种新型端到端眼底微动脉瘤检测网络。该网络将原始U-Net结构中的四个下采样步骤削减至两个,将解码部分的反卷积改为上采样和卷积,将跳层拼接连接方式改进为跳层减连接方式。所设计的网络结构具有两方面的优势:第一,跳层连接方式的改变有利于网络学习到区分度不高的小目标特征并尽可能地保留更多的疑似病灶区域;第二,通过减少原始模型中的卷积层,大大降低了模型的参数量,有利于模型的轻量化和缩短模型的推理时间。在E-Ophtha-MA数据集上的实验结果表明,所提模型将原始模型的参数量降至原来的5.41%,将1440×960尺度的眼底图像微动脉瘤检测时间降至2秒;
2、针对当前眼底微动脉瘤病灶级检测效果不佳的问题,本文提出了一种基于Dice系数的加权损失函数。在网络学习的过程中,利用损失函数降低简单样本的损失权重并增加困难样本的损失权重,可以指导网络实现更多目标区域的召回。在进一步的实验中发现,降低网络最后一层激活函数的最大斜率有利于保留网络输出的概率区分度。因此,本文提出了一种基于Sigmoid的长尾激活函数,既保留了原函数的值域归一化功能,又可以保留网络预测图像的概率区分度。在ROC数据集和E-Ophtha-MA数据集上进行的大量实验表明,所提方法使得困难区域的平均识别率提升4.79%。从绘制的FROC曲线中可以看出,所提方法在微动脉瘤检测方面的泛化能力较强,并且取得了较有竞争力的性能;
3、尽管深度学习具有快速审查大量医学影像并做出诊断的潜力,但其临床可解释性仍具挑战。本文利用公开的糖尿病眼底病灶分割数据集,按比例组成了健康的眼底图像集和包含糖尿病性视网膜病变的眼底图像集。利用ResNet-18分类网络实现了有无病变的二分类。再通过可视化正向传播时卷积核的输出和反向传播时网络中的权重系数,突出显示了图像中对分类结果比较敏感的像素区域。在合并了E-Ophtha-MA和IDRiD的组合数据集上的分类和可视化实验表明,分类网络更加注重于学习对分类结果比较敏感的病灶区域。