论文部分内容阅读
近年来,随着计算机技术、互联网技术和多媒体技术的迅猛发展,图像数据量快速膨胀。数码相机、数字摄像机和智能手机等设备的普及使图片采集更加方便,低廉的存储介质和便捷的网络接入加速了图片的存储与分享。图像越来越多的作为承载和传递信息的媒介,如何从图像中获得有效的信息成为亟待解决的问题。 图像是计算机能够利用的物体表象信息之一。不断膨胀的图像数据为计算机视觉分析提供了丰富的信息资源,同时也提出了严峻的挑战。很多因素会影响成像的结果,因此构成图像的要素(如形状、颜色等)并不稳定。当拍摄图像时,若物体处于不同的光照条件、使用不同的相机、使用不同的相机白平衡模式或者计算机处理时采用不同的颜色空间,会导致物体在图像中会表现出不同的颜色;若拍摄者选择不同的角度时,会导致物体在图像中的形状发生变化;若相机拍摄时与物体距离不同时,会导致物体在图像中具有不同的大小和细节度(即尺度)。复杂的数据采集条件和环境,使得同一物体在不同的图像中呈现出不同的表象信息。在图像处理、计算机视觉和模式识别等领域,往往需要从大量的图像表象信息中提取标识物体不变性的特征量,并以该特征量作为后续处理的基础,分析图像的不变特征成为众多领域的共性问题,是解决这些领域其他问题的基础,具有广泛的应用价值。 基于图像数据膨胀和应用越来越广泛的背景,本文致力于分析图像表象信息中所蕴含的不变特征,从而实现图像内容的有效表达和物体的唯一识别。本文研究方法建立在已有的几何不变量理论的基础之上,该理论已有50多年的研究历史,并得到了广泛的应用,所以本文提出的图像不变特征,也称为图像不变量。但已有的不变量大多只考虑几何、颜色等因素的单一变换或简单组合变换的情况,因此适用性有限。此外,已有的不变量构造方法扩展性较差,并且缺乏明确的几何意义。 本文基于几何不变量理论,致力于复杂成像条件下图像变换的分析,特别是复杂的组合变换,在此基础上进行图像不变量的推导,并将其应用于图像检索、物体识别和三维重建结果评价等领域。本文主要工作和创新点有: 1)提出一种颜色仿射不变量的构造框架,利用颜色基元构造颜色核,然后对颜色核进行多重积分得到不变量。该方法具有很好的扩展性,通过改变不变核能推导出任意阶次、无穷多的不变量;用于构造不变核的不变基元具有明确几何意义;本文还并对不变核的选择进行了讨论。颜色仿射变换是在统计意义下解释室外场景图像之间颜色变换的最好模型,在该变换下构造的不变量能适用于复杂的光照变化条件。通过与已有的颜色特征进行图像检索和物体识别实验对比,结果表明本文构造的颜色仿射不变量在不同光照、不同视角、不同白平衡和不同颜色空间等条件下都具有更好的适用性。 2)提出一种形状-颜色混合不变量的构造框架,分别考虑了形状仿射-颜色对角偏移变换和形状仿射-颜色仿射变换的情况,首次提出了直接构造形状和颜色双仿射变换不变量的方法,适用于目前最复杂的颜色线性变换以及形状线性变换的情况。图像检索实验结果表明,本文提出的混合不变量比已有的不变量具有更好的稳定性和区分能力。 3)提出一种仿射-卷积不变量的推导方法,证明了图像在同时经过仿射变换和卷积变换时,其相位谱图像仅发生了仿射变换,因此,对原图像的相位图像计算仿射不变量能够得到在几何形变、模糊变化下具有不变性质的特征。通过对合成变换图像和真实场景图像的检索实验,证实了仿射-卷积不变量在视角变化和图像模糊条件下的有效性和适用性。 4)提出一种基于图像的三维重建结果评价方法,解决了已有评价方法需要获取真实三维数据所造成的效率低和成本高的问题。该方法首先提取相近视点下真实物体图像与三维重建物体的二维投影图像的边缘图像,然后分别计算由相位矩不变量构成的特征向量,最后利用特征向量的相似性来评价重建结果的好坏。通过对已有重建算法的重建结果进行评价,并与已有评价方法的结果对比,证实了本文方法的有效性。