论文部分内容阅读
随着人工智能技术的不断发展,许多行业孵化出了与人工智能相关的应用。人工智能+医疗就是其中很重要的一个研究方向,人工智能在医疗健康领域的应用前景也正吸引着越来越多的关注。以此为契机,也孕育出了许多利用人工智能技术以医学影像数据为研究载体进行具体的医学领域任务的应用,如早期筛查、辅助临床诊断等。深度学习作为人工智能的一个代表性技术,在学术界和工业界得到了广泛使用,致力于具体实际应用的关键技术突破。在医学领域,利用人工智能的相关技术对疾病的早期筛查是一项非常有意义的工作,不仅能够减轻医务人员的工作量,还能实现快速、便携式检查与诊断。同时,通过早期筛查,医生也能够在病情发展早期对疾病及时地进行干预治疗。利用人工智能的相关技术开发出自动化诊断系统,辅助临床医生做出科学的医学诊断也已成为不可逆转的发展趋势。这一工作不仅能节约医疗资源,也能有效地解决因医生的主观因素造成的漏诊、误诊的问题。本文主要围绕深度学习在自身免疫类疾病检测和眼底疾病筛查及检测两个医学领域的算法与应用展开研究,旨在开发出利用人体上皮(Human Epithelial type 2,HEp-2)细胞进行自身免疫类疾病检测的自动化诊断模型和利用扫描激光检眼镜(Scanning Laser Ophthalmoscopy,SLO)图像进行眼底疾病筛查及自动化诊断模型。主要工作和贡献包括以下几个方面:(1)基于深度监督的全卷积神经网络的HEp-2样本图像分割提出了一个用于HEp-2样本图像自动化分割的DSFCN框架,它能够为后续的HEp-2细胞自动化诊断提供精确的目标区域信息。该框架利用在PASCAL VOC 2012数据集上预训练的VGG-16模型,并充分利用稠密反卷积和多层监督模块。稠密反卷积层能够促使网络学习到大量的浅层特征信息并加以重复利用,以便解码器模块能够恢复分辨率的同时不断保存边缘和轮廓信息,进一步提高分割性能。多层监督模块的加入使得网络能够有效地学习到像素预测值与真实值之间的关联性,并以此来精细化分割结果。大量的实验证明,DSFCN分割框架能够很好地分割出感兴趣区域,在分割HEp-2细胞样本图像任务上具有很可观的分割性能。(2)基于生成式对抗网络的HEp-2细胞分割与分类的网络框架分析HEp-2细胞的着色模式最终目的是为了进行自身免疫类疾病的自动化诊断,精确的HEp-2细胞分割结果能够为HEp-2细胞着色模式分类提供丰富的有效特征信息。因此,以任务为导向,提出了一种新的混合式框架用于联合解决HEp-2细胞分割与分类任务。该框架主要由三个子网络组成,即分割器网络、判别器网络和分类器网络。前两个网络组成了生成式对抗网络用于执行HEp-2细胞的分割任务,第三个网络用于完成HEp-2细胞的分类任务。对于分割器,ResNet-34模型在ImageNet数据集上的预训练参数被用来作为特征编码器以提取多尺度特征信息,并利用多尺度空洞空间金字塔池化(MS-ASPP)模块精细化提取的空间特征信息以获取丰富的边界信息,提高分割性能,进而更好地为分类任务服务。对于判别器和分类器,通过增加原始MobileNetv3模型的中间隐藏输出层的通道数及改变卷积内核大小构建出通道增强的MobileNetv3网络,即ACM-Net,同时实现判别和分类任务。特别地,来自MS-ASPP的特征被利用作为辅助分类器监督主分类器网络以获得更高的HEp-2细胞分类性能,进而实现更加精准的自身免疫类疾病的自动化诊断。(3)基于注意力编码器及多分支网络生成式对抗网络的异常眼底SLO图像检测算法由上一工作可知生成式对抗网络在图像特征提取和合成方面具有很强的可操作性。因此,为了解决眼底SLO图像数据量小的问题及实现异常眼底图像检测任务,以上一工作的方法、思想为导向,提出一种名为AMD-GAN的新式生成式对抗网络以实现异常和正常SLO图像的分类任务。具体地,AMD-GAN的生成器包括两个部分:注意力编码器和基于残差上采样的图像生成流网络。编码器提取真实SLO图像的特征与生成流生成的具有相同尺度的伪SLO图像特征通过注意力模块进行融合,使得生成器生成与真实图像更加贴近的SLO图像。对于判别器,通过复制原始ResNet-34模型的最后两个特征提取层组成另一个分支,建立多分支ResNet-34网络模型,使得提出的判别器比原始的ResNet-34模型提取更多的高水平特征信息,进一步提高判别器对真实SLO图像和生成的伪SLO图像的鉴别能力。此外,深度非对称空洞卷积模块被使用辅助网络提取局部上下文特征信息并加速训练过程。同时,判别器的最后一个输出层被修改以建立分类器,实现最终的异常和正常SLO图像的分类任务。大量的实验结果表明该算法在分类异常和正常SLO图像的任务上取得了十分可观的分类结果,特别地,在专家的先验知识下,取得了最佳的分类性能。(4)基于交叉注意力机制及多分支网络的眼底疾病分类算法提出的AMD-GAN框架能够有效地判别出眼底SLO图像是否为正常的眼底图像,实现异常眼底疾病的初步筛查工作。但临床上,为实现眼底疾病的自动化诊断,更多地会关注患者具体患哪种眼底疾病。以此为研究目的,本部分基于ResNet-34模型提出一种交叉注意力的多分支网络模型,实现三种眼底疾病(视网膜色素变性、糖尿病性视网膜病变及外层渗出性视网膜病变)和正常SLO图像的分类任务,所设计的网络模型主要由四个模块组成:多分支网络结构、空洞空间金字塔池化模块、深度注意力模块和交叉注意力模块。具体地,多分支网络结构选择ResNet-34模型作为骨干网络去扩展网络分支,使得网络能够提取更多的深层次特征,以备后续模块使用。在多分支网络结构中前两个分支的最后一个特征提取层后,加入了ASPP模块,使得网络能够通过设置不同的空洞率而提取到多尺度特征信息,从而获取丰富的空间上下文特征信息。深度注意力模型被用来融合来自ASPP模块的特征和另外一个以原始ResNet-34模型为分支网络提取的特征,以至于整个网络模型在保存全局特征信息的同时又能使得网络聚焦于感兴趣目标区域。为了充分利用多分支网络结构提取的特征信息及迫使网络高亮具体疾病类别相关的特征而抑制与该种疾病不相干的疾病特征,实验中设计了交叉注意力模块,以交叉连接的方式融合来自前两个分支网络的通道注意力和空间注意力模块。