用于低质量医疗图像分割的表示学习

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:liutongyang123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于计算机视觉的自动图像分割是机器辅助医疗图像分析任务中至关重要的步骤。自动且快速地获取具有准确分割掩码的医疗图像,对于帮助医生提高诊断精度、速度以及针对不同病人提供个性化的治疗方案具有重要的意义,针对该技术的研究也是当前科研领域的热点方向。在所有的研究问题当中,由于受到医疗图像独有的对比度低、噪声大、伪影多、内存占用量大以及获取标注信息困难等特性的影响,表示学习成为了提高医疗图像分割性能的核心方向之一。如何在有监督甚至无监督场景之下获取对于大噪声、多伪影、低对比度图像鲁棒的特征表示是分割任务中至关重要的研究问题。本文致力于消除由前述图像特性对分割任务带来的消极影响,针对有监督语义分割、实例分割以及无监督分割场景设计算法,利用深度学习以及核学习等表示学习方法,提取高质量的图像特征,最终提高相应场景下的分割精度。论文的主要创新点概括如下:1.通过改进传统的编码-解码网络连接方式,并向其注入高分辨率语义信息,提出了一种针对低质量医疗图像的语义分割深度神经网络。近年来,语义分割领域的高精度算法大都采用一种由跳跃连接(skip connection)联结的编码-解码网络结构。然而,在很多分割目标边界模糊不清的应用场景中,以上模型往往无法准确定位物体边界实现精准分割。本文中,我们通过分析与实验发现,导致以上问题的主要原因是:通过跳跃连接保存的物体位置信息虽然具有较高的分辨率,但是语义信息欠缺、判别性不够,不足以准确地排除虚假边界以及消失边界带来的消极影响。为了解决这个问题,我们提出了一种高分辨率多尺度编-解码网络(MHMSN)。该网络在已有的两种神经网络通路的基础上(跳跃通路和编解码通路),创新性地加入了第三种高分辨率语义通路,通过引入高分辨率语义信息使得该通路可以同时指导网络提取“是什么”以及“在哪里”两种信息,从而实现对模糊边界更精准的定位。大量的实验证明了所提算法的有效性。此外,在实验中我们还发现,除了众所周知的可以通过提高网络复杂度提升分割精度之外,合理选择语义信息的分辨率也能极大地影响网络的分割精度。2.通过挖掘纹理信息之外的物体结构信息,提出了一种对于分割目标形状和大小鲁棒且对低对比度以及高噪声不敏感的实例分割算法。现有的实例分割方法主要分为基于检测框和不基于检测框的算法。然而,我们发现在医疗图像的应用场景中,非常规的物体形变和密集分布的分割目标常使得基于检测框的分割算法难以实现对实例的准确定位。而图像当中由于低分辨率导致的模棱两可的边界,挑战了不基于检测框算法中以检测边界点为核心的分割机制。为了解决这些问题,我们提出了一种基于深度判别监督的非检测框算法。在此算法中,一种新颖的深度判别监督模块(DDS module)被加入到精心设计的多任务全卷积神经网络中。由于该模块的加入,鲁棒的实例级信息,尤其是实例的结构信息被引入到网络中,极大地提高了网络的分割精度。以该算法为主体,我们获得了MICCAI 2018年度两个国际细胞分割竞赛的第2名与第6名。3.针对无监督分割任务容易受到噪声影响的问题,提出了一种基于子空间聚类的鲁棒多视图信息融合算法。无监督多视图信息融合是一种无监督场景下有效融合多源信息,实现各个视图之间取长补短的表示学习方法。虽然其优异的性能在很多领域已经得到验证,但是医疗图像当中大量的噪声信息仍然极大地影响了表示学习的质量以及分割效果。为了解决以上问题,我们将子空间分割算法同多核聚类相融合,提出了一种基于子空间分割和多核聚类的多视图信息融合算法。在我们的优化范式中,经过精心设计的噪声表示矩阵以及两个稀疏约束条件,极大地缓解了噪声对于表示学习的消极影响。为了高效求解以上优化问题,我们提出了一种新颖的乘子交替方向法(ADMM)。在多个合成数据集以及基准数据集上的实验结果,验证了本文算法的优异性能。4.通过更有效地保存数据内部的局部几何结构,提出了一种基于超像素的多核聚类分割算法。基于超像素的多核聚类算法是一种重要的无监督图像分割算法,其通过挖掘每个超像素中来自多个基核矩阵的互补信息实现最优分割。为了更好地提取并融合每个超像素的判别信息,我们提出了一种简单有效的基于邻居核的多核聚类算法。在该方法中,我们首先设计了一种能够更好地保存核矩阵内部对角分块结构,并且提高核矩阵对于噪声和异常点鲁棒程度的邻居核(neighbor-kernel)。然后,我们将每个视图中提取的邻居基核线性组合,利用提出的带有精确秩约束的子空间聚类算法提取多视图的共享邻居矩阵。最后,基于该矩阵进行图像分割。为了准确求解以上优化问题,我们提出了一种高效的迭代优化算法,并且证明了其有效性。通过推导,我们发现带有精确秩约束的岭回归问题的最优解是无约束岭回归问题最优解对于其主成分的反向映射,揭示了两个问题的联系以及施加精确秩约束的物理意义。通过在多个数据集上开展大量实验,我们证明了所提算法的有效性。5.通过深入挖掘数据内部的高阶邻居信息,提出了一种基于多视图谱聚类的分割结果后期融合算法。后期融合是一种将多个分割结果综合考虑并有效结合,从而提高分割性能的技术手段。为了更好地实现无监督场景下的后期融合,我们改进现有的多视图谱聚类算法提出了一种基于最优邻居拉普拉斯矩阵的多视图谱聚类方法。为了构造能够融合多算法结果的最优拉普拉斯矩阵,现有算法通常将一组事先给定的一阶拉普拉斯矩阵线性组合,通过寻找最优组合系数来实现信息融合。然而近期的研究结果表明,这种方式极大地限制了学习得到的最优拉普拉斯矩阵的表达能力,并且没有充分挖掘数据内部的结构信息。为了解决这个问题,我们提出了一种最优邻居多视图谱聚类算法(ONMSC)。具体而言,本文方法通过同时在一阶和高阶拉普拉斯矩阵所张成线性空间的邻居空间当中搜索最优的拉普拉斯矩阵表示,极大地扩展了最优矩阵的搜索空间,有效地利用了数据内部的高阶邻居信息,获得了更好的分割效果。为了求解文中的优化问题,我们提出了一种高效且收敛性可证的优化算法。通过大量的实验验证,我们证明了算法的有效性。
其他文献
量子计算作为一种利用量子力学基本原理来完成计算任务的新兴技术,具有经典计算无法比拟的强大计算能力,一经提出就获得广泛关注。尤其在大数质因子分解与Grover搜索等量子算法提出之后,人们更加深刻的认识到量子计算或将为整个信息处理领域的演进与发展带来强劲动力。最近,许多国家颁布了关于量子计算研究的中长期发展规划,不断为该领域的技术实现与应用探索加码提速。作为一项应用广泛的信息技术,数据挖掘旨在从海量数
城市计算是计算机科学以城市为背景,跟城市规划、交通、能源、环境、经济和社会学融合的新兴交叉领域。城市计算的任务,是首先通过感知、获取城市中产生的各类大数据,然后采用高效的数据管理技术、先进的算法以及新颖的可视化技术来分析处理及展示大数据,用以解决城市中存在的诸多问题和挑战,如交通拥堵、空气污染、规划落后等。城市内产生的大数据多种多样,如人或车移动时产生的轨迹数据、各大媒体平台发布的新闻、股市里时刻
随着大数据时代的到来,网络空间的数据资源越来越丰富,其数据量已经远远超出了传统数据分析技术和信息系统的处理能力,寻求海量数据中的有效的信息已成为各领域的迫切需求。知识图谱以其语义网的本质,将客观世界存在的实体、关系、属性等概念以结构化知识的形式连接成庞大的网络,作为人类描述知识的重要载体,为大数据环境下的信息获取提供了便捷快速的解决方法。其中,人物实体作为信息交互的枢纽,往往在寻找目标知识的过程中
当今社会,无线通信为人们打开了俯瞰世界的视野,并逐步成为人们生活中密不可分的一部分。然而,随着社会的不断进步,无线通信的发展面临着诸多挑战。一方面,新兴概念如虚拟现实(virtual reality,VR)、物联网(Internet of things,Iot)、智能制造等的出现对无线通信的吞吐率、延迟、可靠性等方面均提出了新的更高要求。而另一方面,适合无线通信的频谱资源又非常有限。因此,增强对现
面对不断提高的卫星成像分辨率以及快速增加的在轨卫星,天基对地观测卫星系统获取数据的速度和总量都呈爆炸式增长。据报道,我国在轨卫星每天获取的对地观测数据高达数百个TB,而且增长势头强劲,这意味着对地观测大数据时代已经来临。当前,用户对卫星对地观测数据服务提出新要求。在时间分辨率上,用户急需卫星对地观测数据在获取、传输、处理和分发整个流程中的响应趋向近实时化;在空间分辨率上,用户需要卫星图像的分辨率高
在大规模分布式智能视频监控中,终端摄像头连续不断地向远程服务器发送所采集的视频数据,不仅需要较大的网络带宽和存储空间,而且网络传输延迟较大,面临采样视频压缩的严峻挑战。压缩感知能从基于少量采样点获取的测量值中重构原始数字信号,并在采样过程中完成数据压缩,非常适合于在智能监控终端完成高压缩率的监控视频采集。然而,目前的大部分压缩感知方法采用单一测量率进行压缩感知采样和重构,导致重构质量和采样压缩率的
软件是互联网生态重要组成部分,然而由于设计不当、开发失误等原因,软件中存在形式多样的漏洞,对软件安全乃至互联网安全带来严重安全隐患,不仅威胁个人隐私与财产安全,也对国家战略安全造成重大威胁。通过自动化手段挖掘软件漏洞,发现系统安全隐患并及时防护,是保证系统安全、稳定运行的必要手段。因此,软件漏洞自动化挖掘技术研究具有极高学术价值与现实意义。模糊测试是一种应用广泛的软件漏洞自动化挖掘技术。自其提出以
随着片上系统规模的不断扩大和处理核数的增多,系统对于片上Cache在容量和速度方面有了更高的要求。为了能够有效利用Cache资源,通常采用非一致Cache访问(NUCA)结构以支持高容量低延迟的Cache组织。另一方面,片上网络由于具备良好的可扩展性在片上众核处理器的互连方式上具有显著优势。因此,基于片上网络的非一致Cache访问体系结构逐渐成为未来众核处理器用于组织大容量Cache的主流系统架构
同时定位与建图(SLAM)是计算机视觉领域的重要问题,在无人驾驶、自主导航、成像制导、侦察等领域有着广泛应用。红外相机可以在夜间、雾霾、光照差的环境下成像,具有全天工作能力,因此红外SLAM比可见光SLAM的潜在应用场景更广。但是由于红外数据获取困难、图像纹理弱、信噪比低,国内外对红外SLAM的研究十分有限。本文以适用于红外成像的SLAM系统为研究目标,在研究过程中主要解决了红外相机标定、SLAM
云计算平台是支撑互联网应用服务和大数据处理不可替代的基础设施,已经广泛应用于人类的生产、生活和城市治理的方方面面,呈现出大量数据密集型应用和日益提高的多应用粘合度,这不断加剧了云计算平台的I/O压力。为了支持应用迁移,提高云服务可靠性,云计算平台中的虚拟机使用分布共享存储资源来存储其关键数据。共享存储通过内部网络(如以太网)互连,大数据量存取的带宽可超过单磁盘带宽,但是,在小量数据存取时,延迟大,