基于注意力机制的图像显著性检测的研究

来源 :江南大学 | 被引量 : 0次 | 上传用户:zhangcwx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人类凭借眼睛和神经系统可以在极短的时间内发现场景中有价值的信息,若能使计算机具备这种快速信息提取能力,便可使它们高效地服务人类生活。图像显著性检测就是让计算机拥有人类的视觉注意力机制,利用图像自身特征计算出每个像素点属于前景的概率,进而分割出图像中的显著物体。本文根据人类的注意力机制,对自底向上的图像显著性检测方法进行研究,并将静态图像显著性检测方法与视频中图像的运动信息结合,从而计算视频序列中多帧图像的显著性,主要研究内容如下:(1)针对当前图像显著性检测算法存在的边缘检测不清晰和内部不均匀的问题,提出一种以无向权重图为基础,结合多特征传播计算图像显著性的检测方法。首先以超像素为节点构建无向图并改进边界超像素的连接方式。在改进的图的基础上利用图像颜色、纹理特征和局部对比及中心先验等多种先验知识提取高层特征,并得到基于底层特征的显著图。其次,利用高层特征和显著物体的紧凑性分别计算基于前景、背景种子的显著图并融合。最后,将两阶段得到的显著图融合得到最终的显著图。实验表明该算法能更清晰的检测出显著物体的边缘,且能均匀突出整个显著区域。(2)针对复杂环境下,当前图像显著性检测算法难以正确检测显著物体的问题,提出结合稀疏重构误差和显著区域紧凑性计算图像显著性的方法。首先利用结构提取方法对图像预处理,弱化图像中的背景噪声,并将处理后的图像分割成若干超像素。之后一方面利用边界超像素构建背景字典,将各超像素投影在该字典上进行稀疏重构,利用重构误差得到基于稀疏重构的显著图。另一方面利用图像中显著物体的紧凑性分别计算基于前景、背景种子的显著图,融合后得到基于紧凑性的显著图,最后将由稀疏重构误差和紧凑性得到的显著图融合得到最终的显著图。在图像构成相对复杂的数据集上进行对比实验,结果表明该算法具有较高的准确率。(3)针对运动场景显著性检测的研究,将静态图像显著性检测方法延伸到视频中,提出了一种利用图像静态空间特征和运动特征计算视频中各帧图像显著性的方法。首先将图像分割成若干超像素,之后一方面利用超像素颜色、位置等静态空间特征获得背景集构建背景字典,并将所有超像素在背景字典上稀疏重构得到各帧图像的显著图。另一方面提取图像运动特征,利用运动特征获得背景集构建背景字典,再次利用超像素的稀疏重构误差获取各帧图像的显著图,然后将两阶段显著图融合。最后使用能量函数对显著图进行全局优化得到最终显著图。实验表明该算法能有效突出视频中的前景且抑制背景的能力较强。
其他文献
多传感器系统的状态估计融合理论目前已经被广泛应用于军事及民用领域。估计信息的融合能够充分利用来自于不同传感器的观测信息,从而获得系统状态的最佳描述,同时能够提高系
在脉冲功率技术中,如何产生具有准确波形的高压脉冲至关重要。一种基本的方法是利用Marx发生器和脉冲形成线来产生脉冲,但能量转移环节较多且脉冲形成线体积相对较大,限制了
运动目标跟踪是当前计算机视觉领域中重要的研究课题之一。通过对摄像头采集的数字视频图像进行逐帧地处理,实现对视频中某个或某些感兴趣区域的定位与跟踪。近年来,在大量研
人类生活与水体环境息息相关,目前水域中金属离子污染情况严峻,对人类健康造成影响。Cu2+作为生物体内重要的微量元素,在人体细胞内浓度需维持在较低水平。由此可见,对环境和
行为识别是计算机视觉的重要研究领域之一,因其具有实际应用前景,吸引了许多国内外学者的广泛关注,并且涌现了许多有价值的研究成果。但是,行为识别研究依旧面临和其他计算机
随着现代电子技术和生物技术的发展,神经形态计算逐渐引起学术界的广泛关注。它通过模拟人脑的神经网络来实现模式识别、自动控制和信息处理等方面的功能。但是由于网络规模
随着合成孔径雷达(Synthetic Aperture Radar,SAR)技术的发展,SAR图像分辨率大幅度提高,图像数据成海量式发展。SAR图像处理技术广泛应用于遥感领域,舰船目标检测是SAR图像解
随着航天科技的发展,遥感数据呈现井喷之势,传统基于地面的处理方式无法满足遥感数据转化为情报信息的实效性要求,因此,本文针对在轨遥感数据实时处理的关键技术,重点围绕SAR
光纤泵浦耦合器作为光纤激光器中最关键的光纤无源器件之一,其纤芯输出光场可以直接决定放大器输出激光的光束质量;目前,国内外对输出纤芯直径40μm以上的高光束质量泵浦耦合
夏季平流层盛行强东风,Rossby波能量难以从对流层向上传播至平流层,而冬季平流层盛行西风,Rossby波能量容易上传,因此以往对Rossby波能量向平流层传播的研究多考虑冬季的情况