论文部分内容阅读
基于计算机视觉的自动图像分割是机器辅助医疗图像分析任务中至关重要的步骤。自动且快速地获取具有准确分割掩码的医疗图像,对于帮助医生提高诊断精度、速度以及针对不同病人提供个性化的治疗方案具有重要的意义,针对该技术的研究也是当前科研领域的热点方向。在所有的研究问题当中,由于受到医疗图像独有的对比度低、噪声大、伪影多、内存占用量大以及获取标注信息困难等特性的影响,表示学习成为了提高医疗图像分割性能的核心方向之一。如何在有监督甚至无监督场景之下获取对于大噪声、多伪影、低对比度图像鲁棒的特征表示是分割任务中至关重要的研究问题。本文致力于消除由前述图像特性对分割任务带来的消极影响,针对有监督语义分割、实例分割以及无监督分割场景设计算法,利用深度学习以及核学习等表示学习方法,提取高质量的图像特征,最终提高相应场景下的分割精度。论文的主要创新点概括如下:1.通过改进传统的编码-解码网络连接方式,并向其注入高分辨率语义信息,提出了一种针对低质量医疗图像的语义分割深度神经网络。近年来,语义分割领域的高精度算法大都采用一种由跳跃连接(skip connection)联结的编码-解码网络结构。然而,在很多分割目标边界模糊不清的应用场景中,以上模型往往无法准确定位物体边界实现精准分割。本文中,我们通过分析与实验发现,导致以上问题的主要原因是:通过跳跃连接保存的物体位置信息虽然具有较高的分辨率,但是语义信息欠缺、判别性不够,不足以准确地排除虚假边界以及消失边界带来的消极影响。为了解决这个问题,我们提出了一种高分辨率多尺度编-解码网络(MHMSN)。该网络在已有的两种神经网络通路的基础上(跳跃通路和编解码通路),创新性地加入了第三种高分辨率语义通路,通过引入高分辨率语义信息使得该通路可以同时指导网络提取“是什么”以及“在哪里”两种信息,从而实现对模糊边界更精准的定位。大量的实验证明了所提算法的有效性。此外,在实验中我们还发现,除了众所周知的可以通过提高网络复杂度提升分割精度之外,合理选择语义信息的分辨率也能极大地影响网络的分割精度。2.通过挖掘纹理信息之外的物体结构信息,提出了一种对于分割目标形状和大小鲁棒且对低对比度以及高噪声不敏感的实例分割算法。现有的实例分割方法主要分为基于检测框和不基于检测框的算法。然而,我们发现在医疗图像的应用场景中,非常规的物体形变和密集分布的分割目标常使得基于检测框的分割算法难以实现对实例的准确定位。而图像当中由于低分辨率导致的模棱两可的边界,挑战了不基于检测框算法中以检测边界点为核心的分割机制。为了解决这些问题,我们提出了一种基于深度判别监督的非检测框算法。在此算法中,一种新颖的深度判别监督模块(DDS module)被加入到精心设计的多任务全卷积神经网络中。由于该模块的加入,鲁棒的实例级信息,尤其是实例的结构信息被引入到网络中,极大地提高了网络的分割精度。以该算法为主体,我们获得了MICCAI 2018年度两个国际细胞分割竞赛的第2名与第6名。3.针对无监督分割任务容易受到噪声影响的问题,提出了一种基于子空间聚类的鲁棒多视图信息融合算法。无监督多视图信息融合是一种无监督场景下有效融合多源信息,实现各个视图之间取长补短的表示学习方法。虽然其优异的性能在很多领域已经得到验证,但是医疗图像当中大量的噪声信息仍然极大地影响了表示学习的质量以及分割效果。为了解决以上问题,我们将子空间分割算法同多核聚类相融合,提出了一种基于子空间分割和多核聚类的多视图信息融合算法。在我们的优化范式中,经过精心设计的噪声表示矩阵以及两个稀疏约束条件,极大地缓解了噪声对于表示学习的消极影响。为了高效求解以上优化问题,我们提出了一种新颖的乘子交替方向法(ADMM)。在多个合成数据集以及基准数据集上的实验结果,验证了本文算法的优异性能。4.通过更有效地保存数据内部的局部几何结构,提出了一种基于超像素的多核聚类分割算法。基于超像素的多核聚类算法是一种重要的无监督图像分割算法,其通过挖掘每个超像素中来自多个基核矩阵的互补信息实现最优分割。为了更好地提取并融合每个超像素的判别信息,我们提出了一种简单有效的基于邻居核的多核聚类算法。在该方法中,我们首先设计了一种能够更好地保存核矩阵内部对角分块结构,并且提高核矩阵对于噪声和异常点鲁棒程度的邻居核(neighbor-kernel)。然后,我们将每个视图中提取的邻居基核线性组合,利用提出的带有精确秩约束的子空间聚类算法提取多视图的共享邻居矩阵。最后,基于该矩阵进行图像分割。为了准确求解以上优化问题,我们提出了一种高效的迭代优化算法,并且证明了其有效性。通过推导,我们发现带有精确秩约束的岭回归问题的最优解是无约束岭回归问题最优解对于其主成分的反向映射,揭示了两个问题的联系以及施加精确秩约束的物理意义。通过在多个数据集上开展大量实验,我们证明了所提算法的有效性。5.通过深入挖掘数据内部的高阶邻居信息,提出了一种基于多视图谱聚类的分割结果后期融合算法。后期融合是一种将多个分割结果综合考虑并有效结合,从而提高分割性能的技术手段。为了更好地实现无监督场景下的后期融合,我们改进现有的多视图谱聚类算法提出了一种基于最优邻居拉普拉斯矩阵的多视图谱聚类方法。为了构造能够融合多算法结果的最优拉普拉斯矩阵,现有算法通常将一组事先给定的一阶拉普拉斯矩阵线性组合,通过寻找最优组合系数来实现信息融合。然而近期的研究结果表明,这种方式极大地限制了学习得到的最优拉普拉斯矩阵的表达能力,并且没有充分挖掘数据内部的结构信息。为了解决这个问题,我们提出了一种最优邻居多视图谱聚类算法(ONMSC)。具体而言,本文方法通过同时在一阶和高阶拉普拉斯矩阵所张成线性空间的邻居空间当中搜索最优的拉普拉斯矩阵表示,极大地扩展了最优矩阵的搜索空间,有效地利用了数据内部的高阶邻居信息,获得了更好的分割效果。为了求解文中的优化问题,我们提出了一种高效且收敛性可证的优化算法。通过大量的实验验证,我们证明了算法的有效性。