论文部分内容阅读
对医学图像的内容理解是应用计算机视觉与人工智能进行医学影像分析的基本问题之一,从二维或三维影像数据中理解图像内容一直是医学图像应用研究的重点领域,涉及到感兴趣目标的去噪、分类、检测、分割和检索等研究内容。由于图像内容理解问题本身的困难性和医学图像内在特有的领域先验,如超声特有的斑点噪声,衰减和阴影,导致目标受尺度、旋转和形变等因素影响而形成不同的成像,使得用计算机对医学图像中的内容进行鲁棒的表达与理解依然是一个严峻的挑战。由于不同具体视觉任务分别处于图像抽象的不同层次,解决医学图像的内容理解问题的关键是如何有效结合低层的图像数据信息和高层的语义信息。 以深度学习为代表的人工智能技术在医学影像分析领域取得了引人注目的研究进展。但仍有一系列问题难以克服:如何确定不同网络结构对高效学习医学图像特征表示的影响,如何设计网络结构以适应医学数据量偏少的问题;深度学习具有优异泛化能力从何而来,如何从深度可视化理解深度学习的理论可解释性?学习到的特征表示能否高效应用于不同的医学图像内容理解任务,能否同时应用于分类、检测、去噪和分割等。针对以上问题,论文工作主要涉及深度卷积神经网络自动提取分层递阶图像特征表示,并把不同层次的特征表示应用到不同抽象层次的图像内容理解研究任务上,论文在深入分析传统计算机视觉算法优缺点的基础上,重点研究了应用深度学习的医学图像分类识别、深度卷积神经网络模型的可视化和基于感知损失的去噪模型,并致力于利用形状先验信息结合深度卷积神经网络解决医学图像特定目标检测与分割等问题。论文的主要工作和创新之处在于: 针对医学图像特征表示的高层语义识别分类问题,通过构建超声心动图标准切面数据集,提出了一种基于深度卷积神经网络自动识别分类标准切面的方法,该方法引入空间金字塔均值池化层替代全连接层,利用全局空间金字塔均值池化方法进行微调迁移学习,减少模型参数、降低过拟合风险,详尽分析了数据规模对模型分类精度的影响,并对模型的可解释性和有效性进行了分析,表明深度卷积神经网络能较好地解决医学图像内容理解的高层语义识别分类问题。 针对基于深度卷积神经网络的图像分类模型的可解释性问题,通过评估模型特征空间的潜在可表示性,提出一种用于改善理解模型特征空间的可视化方 法。给定任何已训练的深度卷积网络模型,引入激活最大化的图像可解释性方法,利用空间金字塔分解,并构建多尺度拉普拉斯金字塔主动提升目标图像特征空间的低频分量,结合多尺度高斯金字塔调整其特征空间的高频分量得到较优的可视化效果。并通过限制可视化区域,提出利用类别显著性激活图加以抑制上下文无关信息,可进一步改善可视化效果。该模型有效地克服了原有可视化方法中由于不能主动调整高低频分量等原因造成的可视化图像语义重复和效率低下等问题。 针对自动检测医学图像中指定目标结构时存在的问题,提出了一种基于深度学习自动检测目标位置和估计对象姿态的算法。该算法基于区域深度卷积神经网络和目标结构的先验知识,采用区域生成候选框网络、感兴趣区域池化策略,引入了包括分类损失、边框位置回归定位损失和像平面内朝向损失的多任务损失函数,近似优化一个端到端的有监督定位网络,能快速地对医学图像中的目标自动定位,有效地为下一步的分割和参数自动提取提供定位结果。并在超声心动图左心室检测中提出利用检测额外标记点:二尖瓣环、心内膜垫和心尖,能高效地对左心室朝向姿态进行估计。 针对图像特征表示的低层视觉任务:图像去噪和分割中存在的问题,提出了一个有监督的多层残差全卷积神经网络框架,结合图像内容的感知损失函数学习端到端映射变换;针对医学超声图像难分割的问题,提出一种利用沙漏卷积神经网络特征的多尺度形状模型分割方法,自动定位经食道超声心动图中心室并分割心室内外膜。提出利用堆叠多级沙漏卷积网络建模心室外观的全局和局部信息,统一活动外观模型和局部受限模型的概率形式,采用反向组合梯度下降算法迭代优化分割结果,完成左心室轮廓的自动提取。然后进行详尽实验讨论分析了基于不同层级的沙漏卷积网络对全局和局部纹理特征建模能力,以及对分割效果的影响。实验结果表明,该方法分割效果优于传统形状对齐方法,能够自动定位超声心动图中左心室的初始轮廓和实现弱边界自动分割。