论文部分内容阅读
视觉显著性计算模型以心理学、神经科学、认知理论等领域的研究成果或假说为前提,建立数学模型来模拟人类视觉系统指引注意力分配和视觉认知的过程,通过模拟和仿真人类视觉感知机理,将存在待检测目标的人眼感兴趣区域视为图像中某些特征显著的像素点的集合,计算图像中这些显著点来检测感兴趣区域,从而可以快速而有效地处理视觉数据。在图像分割、目标检测、场景感知等许多图像处理任务中,图像中不同区域对视觉系统刺激程度不同引起的视觉显著性信息将系统资源优先集中于感兴趣区域进行计算分析,降低了处理过程的复杂性,为后续处理提供了极大的便利。论文从对图像处理空间不同的空域模型Itti和频域模型SR展开研究,详细分析了两种模型的形成机理并改进了其特征提取方式及显著图融合策略,提出了一种基于颜色特征的显著性建模方法。首先介绍了视觉显著性计算模型的研究现状和综述了视觉显著性的基本概念及理论、特征度量方法和通用模型框架;其次针对Itti模型和SR模型的不足,改进了特征提取的方法和显著图融合策略的方式;最后本文将视觉系统对颜色的敏感性引入到显著性模型的特征提取阶段,通过提取图像颜色的红、绿、蓝三通道和宽频调谐信息形成特征图,各特征显著图通过线性融合形成最终的显著图来引导视觉的注意,寻找目标区域。论文还设计了随机矩形框、滑动窗口、对称环绕窗口、多尺度滑动窗口等四种改进初步特征图的方法,能有效消除显著图中的背景信息,突显出图像中的感兴趣目标,为后续应用带来方便。实验表明,本文提出和改进的视觉显著性模型能够有效地检测出图像中的目标信息,最大限度地消除背景和噪声信息,将人眼感兴趣区域突显出来。论文还利用本文提出和改进的算法模型并集成现有优秀的显著性算法,在MATLAB下开发了显著性算法处理平台。论文还在本文方法基础之上引入频谱分析的方式、二值化、形态学等图像处理方法,使其能够对车辆牌照、交通标志、地形图中的文字符号和遥感图像中的团块目标进行检测和定位,弥补了现有方法存在的漏检测和错检测的缺陷,证明了其算法的实用性。