论文部分内容阅读
视觉是人类感知世界和认识世界的最主要方式。人类视野中获取到信息往往非常丰富,这些信息给予视觉系统多样化的刺激,通过神经系统的支配,它们相互影响、融合,形成了人的视力。人们能够快速的从复杂的场景中精确定位到自己感兴趣的区域或目标,并在脑海中对其形成整体映像,计算机对这一过程的仿真称为视觉显著性分析。简单来讲,显著性分析就是对场景中对象吸引视觉注意力能力的描述。作为计算机中最主要的视觉载体,数字图像中存在着大量的冗余信息,其最重要的内容往往只集中在一些小的关键区域,这些区域最能吸引人的注意,也最能表征图像内容,被称为显著性区域或感兴趣区域。高效的对这些区域进行检测、提取并表示,具有重要的应用价值。近年来,以图像显著性区域检测为基础的视觉计算模型蓬勃发展,逐渐成为一个热门的研究方向。本文主要介绍图像显著性区域提取的相关技术理论,所做的具体工作包括:1.提出了一种基于全局对比的显著性区域检测方法。利用自适应大小的图像分块技术分割图像,以颜色、分块相似性和空间位置关系作为基本特征,计算多分辨率下图像中各像素的显著程度。通过插值算法对各分辨率下图像的显著性进行融合,得到规一化的显著图,最后以阈值法提取显著性区域。由于算法在计算显著性时已经对图像进行了合并,所以在显著图生成后不需进一步分割。相比现有的各种基于对比的算法,该算法简单快速,计算复杂度低。同时,实验结果表明,本文算法提取效果相比CA算法和RC算法有所提高,更加符合人类的视觉注意机制,更好地匹配了眼动数据参考模板。2.提出了一种基于多尺度滤波的频域显著性区域提取方法。首先对图像进行多尺度建模,在高尺度空间,利用高斯拉普拉斯滤波器对原图像带通滤波,保留图像中清晰的轮廓信息,而在低尺度空间通过傅里叶变换对图像幅度谱的剩余谱差分均值滤波,突出区域的整体性,之后,分别计算每一尺度下图像的视觉显著性,并且引入权值函数归一化得到图像的显著图,最后利用改进的K-means聚类方法对显著图进行分割,阈值化后生成显著性区域。与已有的各种频域方法相比,本文算法更加突显了显著性区域的整体性。在生成的显著图中,显著性区域轮廓更加清晰,区域内外纹理都被明显淡化,并且提取结果的查全率和查准率都有所提高。