基于视觉显著区域的图像分割算法研究

来源 :江南大学 | 被引量 : 0次 | 上传用户:gag123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像分割作为目标分析与识别、目标跟踪等高级图像处理操作的一项基础且关键的步骤,其分割结果的好坏直接影响后续处理操作。现有的图像分割算法可根据人工参与与否,将其分为交互式分割和自动分割。前者由于其良好的分割性能,得到了广泛的应用。但当面对的图像数据量较大时,相应的需要消耗更多的人力且较费时,无法满足实际需求。近年来,基于视觉显著区域检测算法的研究取得了不错的成果,许多研究人员将其与已有图像分割算法结合起来,为自动化分割算法提供更多可能。然而,基于视觉显著区域检测算法在含有灰度分布不均匀、复杂背景及与背景特征(如灰度、颜色)相似的前景等图像中仍无法有效检测出图像中的显著区域,影响了图像分割精度。因此,本文主要针对基于视觉显著区域的图像分割算法展开研究。本文的主要研究工作以及创新点如下:(1)提出一种基于区域的自动初始化主动轮廓模型(initial contour based on visual salient region-region based hybrid active contour model,ISR-RBHM)。该模型首先利用了改进的视觉显著区域检测算法对待分割图像进行预处理操作,获取目标候选区域,自动设置初始化轮廓曲线;其次,将获取的目标先验信息与待分割图像中具有最大对比度的位图相结合,设计自适应符号函数,对优化Lo G(laplacian of gaussian,Lo G)能量项进行加权,以线性方式融合到RSF(region-scalable fitting,RSF)模型中,增强模型的自适应能力;最后,设计新的局部灰度测度,与局部核函数相结合,改进局部能量项,提高模型在目标弱边缘处的敏感程度,准确定位目标边界。实验结果表明:ISR-RBHM模型能够有效识别视觉显著区域,自动设置初始化轮廓,并有效保留目标边缘细节,视觉及定量实验结果证明了该模型优于目前一些主流的主动轮廓模型。(2)针对现有视觉显著区域检测算法在含有复杂背景的图像中无法更好的识别出前景目标区域,从而降低分割精度的问题。本文首先构造二层稀疏图,并在此基础上,计算基于紧凑性的显著图,较精确的定位目标区域;其次,选取图像边界的超像素,将其作为背景种子,提出基于背景种子的显著图,并以线性方式与基于紧凑显著图相结合,提出SRCB算法(salient region detection algorithm based on compactness and background seed,SRCB),有效的检测出显著目标区域,并在一定程度上抑制了背景噪声;最后,将融合的显著图结果嵌入到图割框架中,提出SRCB-GC算法(salient region detection algorithm based on compactness and background seed-Grab Cut,SRCB-GC),该算法能够有效消除冗余的背景信息,得到更为精确的二值化分割结果。SRCB-GC算法作为一种自动分割算法,无需人工干预,能够有效的将前景目标区域分割出来,移除背景噪声。实验结果表明,该算法在处理含有复杂背景的图像时具有明显的优越性。(3)提出一种面向RGBD图像的共分割算法。该算法首先构造二层稀疏图,在此基础上,引入深度信息对边缘权重进行优化,获取由深度信息优化的基于前景紧凑性和背景种子的显著图,并以线性方式相结合,得到图像组中单幅图像对应的显著图;其次,选取单幅显著图中的初始前景种子,并结合深度、颜色等信息对初始种子进行筛选,将优化后的前景种子作为稀疏重构的前景字典;再者,计算基于稀疏的全局重构显著图,同时充分利用图像组中两两图像之间的关系构造基于稀疏的局部重构显著图,并以线性方式将基于稀疏的全局和局部重构显著图进行结合,将融合后的稀疏重构显著图与单幅图像对应的显著图以乘性方式相结合,使用能量泛函对融合后的显著图进行优化,得到优化后的显著图;最后,利用图割算法对优化显著图进行分割。由实验结果不难看出,该算法取得了较为满意的分割结果,更能满足人类视觉感官系统。
其他文献
磁共振成像由于其无辐射、多参数、对比度高等特性,被广泛应用到医学成像领域。但是其过长的数据采样时间限制了其应用。自磁共振成像技术被提出以来,各种用于提升成像速度的方法被提出,比如提高最大磁场转换率与并行成像等。而当前研究的一大热点是通过对k-空间数据进行欠采样来快速成像。理论上对k-空间欠采样可以成倍的加快成像速度,但如果采样频率低于Nyquist-Shannon定理,重建出来的图像就会出现严重的
近些年来随着深度学习的发展,基于图像的虚拟试衣技术获得越来越多的关注。目前利用深度学习算法实现虚拟试衣的技术主要有两个,一是基于CAGAN的,但是该网络生成的图像质量不理想,并且无法处理较大的空间变形,二是基于VITON的,但是在试衣前后的图像存在较严重的颜色失真、面对自我遮挡时生成效果不理想以及变形网络存在一些缺陷等。因此,本文对深度学习算法应用在虚拟试衣中出现的这些问题进行了研究和解决,本文的
近年来,人工智能在诸多领域都取得了重大进展,如生物医学、智能交通、智能家居等。医学图像处理是生物医学领域热门的研究方向之一,随着人工智能技术的飞速发展,尤其是深度学习的兴起,该问题有了新的解决方案。应用深度学习技术解决常见的医学图像处理问题已经取得了一定的进展,但仍存在以下挑战:1)医学图像的获取耗时长、花销大,某些图像的获取甚至会对人体产生伤害,如何避免这些限制获得充分的医学图像辅助医生诊断?2
目标跟踪是计算机视觉范畴内一项基础而重要的研究方向,在智能监控,公共安全,人机交互和自动驾驶等诸多科学和技术领域中,都有着广泛的应用。目标跟踪的主要任务可以简单概括为,在已知视频第一帧中某个任意物体具体位置的情况下,尽可能精确地定位出在该目标后续帧中的位置。在实际应用中,由于目标会不可避免地遭遇诸如尺寸变化、形变、运动模糊等干扰因素,因此,本文对基于孪生神经网络的跟踪算法进行了深入调研,并在此基础
随着我国汽车保有量的不断增加,城市停车难问题日益凸显,AGV智能停车库作为缓解停车难问题的新型解决方案,受到了越来越多的关注。在AGV智能停车库中,主要依靠停车AGV来运输车辆,因此AGV的路径规划与协同调度策略的好坏直接关系到停车库能否稳定高效地运行。本文以AGV智能停车库作为研究背景,主要研究AGV的路径规划算法与多AGV协同调度策略,同时为了提高系统的运行效率,对AGV电池充电问题与停车位资
行为识别是人工智能与计算机视觉领域最具挑战性的研究方向之一,在人机交互,医疗健康,智慧安防以及智能机器人等领域有着广泛的应用。行为识别技术的核心是通过聚合视频片段中每帧的预测信息从而实现视频级预测。尽管针对每帧图像的分类技术已经取得了很大的成功,但从二维图像的分类扩展到三维视频的识别仍然有一定的困难。因为从二维图像扩展到三维视频不仅因为计算复杂度的巨大提升,更需要捕捉视频中不同帧之间的时空上下文关
随着在线社交网络的蓬勃发展,越来越多的人喜欢在互联网上以文字的形式表达自己的情感,例如用户可以对已购买的产品进行评价、对外卖订单给出点评、在微博等网站上发表自己对某件事情的看法等等。而对这些包含大量情感、态度、观点的文本进行情感倾向分析已经成为自然语言处理领域的一个非常热门的研究方向,具有实际的商业价值以及学术研究意义。以往的情感分析研究多为篇章级或句子级,即把整段文本归纳为一种情绪,这种研究已经
图像配准是医学影像处理中常用的技术,大量应用于医学的各个领域,包括病灶检测,疾病诊断,手术规划,手术导航和疗效评估等。随着多种医学影像技术的蓬勃发展,从反映解剖结构的形态学成像到反映器官组织的功能性成像,不同模态的医学影像从不同的角度承载着丰富的医学诊断信息,将多种模态的图像进行融合处理,能够为临床治疗提供丰富的功能互补信息。而多种模态的图像融合的基础是将这些图像进行配准。因此,多模态医学镜像的配
我国很多关于书法学习的教材和论著都是从二维平面的角度出发,将书法笔迹看作一幅静止不变的平面图像,但实际上书法笔迹是通过书写运动形成的运动轨迹。运笔速度和书写压力都是笔迹变化的最基本因素之一,也是常见的书写指标,可以用来衡量书法临摹时的相似程度。但是在传统的书法教学模式当中,普遍使用的都是手把手模式,也就是学生在观察并记忆教师书写时的力度、速度、布局及节奏等示范之后,再反复在字帖上进行临摹的学习方式
三维成像技术在当代社会应用广泛,在信息和生命科学领域中尤为突出。物体的三维信息对于人们正确认识和探知其结构、三维形貌等具有重要意义。随着近年科学技术水平的飞速发展,人们对提取物体三维信息的能力的需求也日益增长。现代三维成像也逐步向着高分辨、记录彩色图像、动态成像的趋势不断发展,对传统三维成像技术不断提出了新的挑战。近年来,人们相继开发出许多全新的三维成像技术,其中包括全息术、激光扫描共聚焦显微镜、