论文部分内容阅读
随着互联网、多媒体信息技术、数字电子设备和移动终端的普及,数字图像数量飞速的增长,为此我们需要从这海量的图像信息中迅速且智能的提取出我们所需要的、有用的信息。由于受到视觉注意机制的作用,人们仅对图像中容易引起人们视觉注意的那部分图像的内容感兴趣即图像的显著区域,因此,快速而且准确地提取出图像中的显著区域是十分重要的,且便于对图像后续的处理。本文主要围绕以下几个问题进行分析研究:视觉注意机制是如何影响人类观察外界环境中的图像来获取图像信息的;人类的视觉注意机制是如何快速准确地提取出图像的显著区域的;以利用所提取出来的显著区域如何判别图像是舒服、协调以及视觉平衡的。 本文的主要研究内容是首先根据生物学理论,分别对人类视网膜结构、大脑皮层的组织结构以及外膝体的结构做了简单的介绍;其次对经典的视觉注意模型算法—Itti模型原理进行了详细的分析,并在其基础上提出了改进的模型算法。由于人眼对物体的轮廓形状信息有较强的感知能力,在改进的模型算法中融入了形状特征信息的提取。采用高斯金字塔对原始图像进行分层滤波,应用中心-周边差算法分别提取形状和亮度特征。然后再将原始图像转换到另一种颜色空间,提取图像中的高频部分的信息来作为颜色特征。再对原始图像进行倒数函数滤波进而得到方向特征信息。最后将提取出的四种低层特征的显著图融合成一张最终的显著图。依据构图学和摄影学的理论,对视觉平衡给出了一个新的定义。然后利用改进的模型算法提取出图像的显著图,对显著图进行区域检测求得重要区域的重心,并对图像中显著目标进行主观视觉评价实验。 本文对改进的模型进行了仿真实验,实验结果表明与经典的 Itti 模型算法相比,前者提取出来的显著图更加的清晰明显,算法的速度也比后者有所提高。视觉平衡研究方面对实验数据结果进行统计和分析,进而对所给出的视觉平衡的定义给予了实验验证。同时利用构图学中的视觉平衡分数计算公式在数学方法和构图学上给予了验证,使客观度量与主观感受尽可能的保持了一致。