基于上下文信息的图像分割结果质量评价方法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:flyrat1997
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的来临,图像成为人们获取信息的主要来源之一,针对图像的智能分析与处理已成为众多新型信息产业中必不可少的一环。图像分割是图像智能分析的第一步,是实现图像智能理解的基础,旨在为后续的图像分析任务提供图像内容解析。由于图像前景目标的多样性和背景场景的复杂性,图像分割结果质量差异较大。实现客观高效地分割结果质量评价对于评价分割结果质量的优劣、衡量对比图像分割算法的性能以及指导图像分割算法的优化具有重要的指导意义。图像分割结果质量评价的目的是构建分割质量评价模型,客观高效地衡量图像分割结果的质量,并为后续的计算机视觉任务提供信息指导。而现有的盲分割质量评价方法由于缺少人工分割标注作为参考,仍面临以下几方面的挑战:1)缺少包含图像级和像素级质量标签的图像分割结果质量评价数据库;2)如何提取图像分割结果中更丰富的上下文信息,构建更符合人眼感知的图像级分割质量评价模型;3)如何构建像素级分割质量评价网络,获取图像分割结果的局部质量信息,为后续的计算机视觉任务提供更多监督线索。基于上述挑战,本文针对客观分割质量评价方法开展了一系列研究,具体内容包含以下几个方面:1.针对图像分割结果质量评价数据匮乏的问题,本文基于常用的自然图像数据集和经典的图像分割算法,构建了图像语义分割结果质量评价数据库,该数据库包含图像级和像素级的质量标签,为本文的研究工作提供基础。本文后续所研究的分割质量评价算法均基于该数据库进行。2.针对全局的分割质量评价问题,本文研究了基于多尺度上下文信息的图像级分割结果质量评价方法,基于卷积神经网络,构建了包含多尺度网络结构的分割质量评价框架,能够获取不同尺度的图像上下文信息,并通过回归预测获取分割结果的全局质量得分,实现了图像级的分割质量评价。3.针对局部的分割质量评价问题,本文研究了基于误差谱预测的像素级分割结果质量评价方法,提出了图像分割结果的逐像素误差谱的概念,构建基于CNN的编码器-解码器网络结构。该网络使用自注意力模型捕获全局上下文信息,通过编码器提取图像高层次语义信息,并通过解码器预测细粒度的分割结果误差谱,实现了分割结果的局部质量信息获取,以及像素级的分割质量评价。
其他文献
鲁棒自适应波束形成算法(Robust Adaptive Beamforming,RAB)一直是阵列信号处理领域一个重要的分支,在很多领域都有着广泛的应用。在传统的鲁棒自适应波束形成算法中,普遍存在的一个问题就是估计的期望信号导向矢量会收敛于干扰子空间,使得期望信号被当做干扰抑制,而干扰被当做期望信号无失真输出,从而导致波束形成器的性能下降。为了提高自适应波束形成器对各种误差因素的鲁棒性,本文进行了
人工智能中的推理研究表明人类大脑很多时候并不是完全基于精确推理的,现实世界的信息是不完备的。一方面,信息往往具有不确定性,这意味着我们通常对感兴趣的变量施加软约束(soft constraint)。另一方面,在处理真实世界中不完美的信息时,只考虑不确定性是不够的。信息的另一个重要性质是它的部分可靠性。事实上,对变量的任何估计,无论是精确的还是软的都取决于我们对所处理的信息来源的信心。因此,不确定性
城市环境多路径信号联合探测技术指的是利用城市环境中丰富的电磁波衍射、反射多径信号,实现对建筑环境非直视目标检测、定位、成像及跟踪的技术,其是实现建筑遮蔽目标探测的新质手段,该技术在反恐维稳、城市巷战、区域监视和智能驾驶等领域具有重大的研究和应用价值。本文围绕建筑环境非直视目标探测问题,开展了城市环境多路径信号联合探测的基础理论问题研究,主要内容如下:1、针对复杂城市环境探测场景,首先基于电磁场与电
由于目标与环境场景具有紧密相关性,根据SAR图像场景先验信息,在SAR图像中快速获取目标潜在区域,是提高目标检测效率、降低虚警、实现目标精确检测的首要环节。高分辨率SAR图像地物具有起伏变化明显、纹理特征丰富等特点。基于像素级的处理方法的计算粒度过于精细,而且没有充分考虑像素间的空间组织关系,因此难以有效获取SAR图像多尺度目标潜在区域。本文围绕SAR图像,主要解决多尺度地物分类精度低、目标潜在区
传统保护区采用护林员巡逻方式进行自然防护及动物寻踪,但往往效率较低,且人力物力消耗较大。通过部署保护区通信系统,可以较好的改善信息闭塞的现状,一方面,可提高信息(文本、图像、视频等)的传输灵活性;另一方面,能降低护林员定期维护巡回的频次。不同环境及需求的保护区,可因地制宜地采取网络架设方案:对有配套供电、线缆及机房条件的保护区,可部署有线视频传输系统;对仅有供电条件的保护区,可部署嵌入式无线传感器
三维地质模型是描述及表示地下结构的重要工具,是地质学者研究关键地质构造的参考依据。地震解释数据具有不连续性、不一致性,传统建模过程仅从计算机图形学的角度入手,重构的模型可能存在构造不合理之处,构造建模的难点就是这样信息缺失的条件下构造出符合地质规律的合理模型。因此,从地震解释数据模型中提取出语义信息,是三维地质建模中的关键环节。现有的地质模型语义描述体系着力于对其几何形态的研究,而忽略了其中隐含的
随着计算机和多媒体技术的快速发展,以图像、视频为信息流的互联网、物联网产品不断涌现,自媒体时代已然来临。在直播网站、视频号、影视媒体等依托视频作为信息主要载体的平台上,时时刻刻的传输着海量的视频数据,并呈现着更新周期短、产生速度快、种类多等特点。与此同时视频数据存在着存储成本高、不易维护和检索困难的问题,尤其是监控类视频中包含大量冗余信息,无法快速定位关键信息。因此迫切需要研究一种能对视频中感兴趣
事件推理研究是通过一系列的事件上下文序列来推断后续可能发生的事件,是事件提取与分析方向的研究热点之一。本文的研究对象是具有某种逻辑关系的事件集合,研究目标是根据事件之间逻辑关系的先验信息从候选事件中选择后续最有可能发生的事件。新闻是信息传播的重要载体,其中包含有大量的客观真实事件,从新闻文本中抽取事件并进行推理分析有助于快速准确地从中获取相关事件之间的发展脉络和关联信息。为此,本文提出了一种面向新
由于工程应用的各个领域中,涉及到的数据量级显著增加,越来越多的应用环境需求高速高精度的AD/DA转换器,这一需求促进了接口技术的飞速发展,但器件封装功耗和面积也随之增加。由于以上各种因素,传统的CMOS、LVDS等接口越来越难以适应当今的需求,因此新的高速数据传输接口是如今高速转换器应用领域的一个重点。本文在对协议分层结构进行研究分析后,明确了每个层在数据传输时所负责的具体工作,并且按照标准设计了
地质曲面重构是三维地质建模中重要的一项内容,目前的很多方法都是基于数据驱动的,然而由于原始数据中关键信息的缺失以及数据中存在的不确定性,造成了重构曲面中主要构造形态的变形和扭曲的问题,这与地质专家们对于实际地质曲面的认识不符,通过纯数据驱动得到的重构结果不合理,达不到预期。基于这样的实际情况,本文首先在特定稀疏地质点云数据上进行了构造语义特征的提取工作,构造语义特征是数据中重要的形态表现,构造语义