图像不变性分析与应用

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:sukey2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着计算机技术、互联网技术和多媒体技术的迅猛发展,图像数据量快速膨胀。数码相机、数字摄像机和智能手机等设备的普及使图片采集更加方便,低廉的存储介质和便捷的网络接入加速了图片的存储与分享。图像越来越多的作为承载和传递信息的媒介,如何从图像中获得有效的信息成为亟待解决的问题。  图像是计算机能够利用的物体表象信息之一。不断膨胀的图像数据为计算机视觉分析提供了丰富的信息资源,同时也提出了严峻的挑战。很多因素会影响成像的结果,因此构成图像的要素(如形状、颜色等)并不稳定。当拍摄图像时,若物体处于不同的光照条件、使用不同的相机、使用不同的相机白平衡模式或者计算机处理时采用不同的颜色空间,会导致物体在图像中会表现出不同的颜色;若拍摄者选择不同的角度时,会导致物体在图像中的形状发生变化;若相机拍摄时与物体距离不同时,会导致物体在图像中具有不同的大小和细节度(即尺度)。复杂的数据采集条件和环境,使得同一物体在不同的图像中呈现出不同的表象信息。在图像处理、计算机视觉和模式识别等领域,往往需要从大量的图像表象信息中提取标识物体不变性的特征量,并以该特征量作为后续处理的基础,分析图像的不变特征成为众多领域的共性问题,是解决这些领域其他问题的基础,具有广泛的应用价值。  基于图像数据膨胀和应用越来越广泛的背景,本文致力于分析图像表象信息中所蕴含的不变特征,从而实现图像内容的有效表达和物体的唯一识别。本文研究方法建立在已有的几何不变量理论的基础之上,该理论已有50多年的研究历史,并得到了广泛的应用,所以本文提出的图像不变特征,也称为图像不变量。但已有的不变量大多只考虑几何、颜色等因素的单一变换或简单组合变换的情况,因此适用性有限。此外,已有的不变量构造方法扩展性较差,并且缺乏明确的几何意义。  本文基于几何不变量理论,致力于复杂成像条件下图像变换的分析,特别是复杂的组合变换,在此基础上进行图像不变量的推导,并将其应用于图像检索、物体识别和三维重建结果评价等领域。本文主要工作和创新点有:  1)提出一种颜色仿射不变量的构造框架,利用颜色基元构造颜色核,然后对颜色核进行多重积分得到不变量。该方法具有很好的扩展性,通过改变不变核能推导出任意阶次、无穷多的不变量;用于构造不变核的不变基元具有明确几何意义;本文还并对不变核的选择进行了讨论。颜色仿射变换是在统计意义下解释室外场景图像之间颜色变换的最好模型,在该变换下构造的不变量能适用于复杂的光照变化条件。通过与已有的颜色特征进行图像检索和物体识别实验对比,结果表明本文构造的颜色仿射不变量在不同光照、不同视角、不同白平衡和不同颜色空间等条件下都具有更好的适用性。  2)提出一种形状-颜色混合不变量的构造框架,分别考虑了形状仿射-颜色对角偏移变换和形状仿射-颜色仿射变换的情况,首次提出了直接构造形状和颜色双仿射变换不变量的方法,适用于目前最复杂的颜色线性变换以及形状线性变换的情况。图像检索实验结果表明,本文提出的混合不变量比已有的不变量具有更好的稳定性和区分能力。  3)提出一种仿射-卷积不变量的推导方法,证明了图像在同时经过仿射变换和卷积变换时,其相位谱图像仅发生了仿射变换,因此,对原图像的相位图像计算仿射不变量能够得到在几何形变、模糊变化下具有不变性质的特征。通过对合成变换图像和真实场景图像的检索实验,证实了仿射-卷积不变量在视角变化和图像模糊条件下的有效性和适用性。  4)提出一种基于图像的三维重建结果评价方法,解决了已有评价方法需要获取真实三维数据所造成的效率低和成本高的问题。该方法首先提取相近视点下真实物体图像与三维重建物体的二维投影图像的边缘图像,然后分别计算由相位矩不变量构成的特征向量,最后利用特征向量的相似性来评价重建结果的好坏。通过对已有重建算法的重建结果进行评价,并与已有评价方法的结果对比,证实了本文方法的有效性。
其他文献
目前,工业界各个IT公司面临的数据量急剧增加,且处理的数据类型从单一的结构化类型扩展至复杂的非结构和半结构化的数据类型。在这种背景下,传统型数据库已经不适合这种场景,而以
医学断层图像三维重建是研究基于医疗成像设备获得的二维扫描图像序列来构建组织或者器官的三维几何模型,并在计算机显示输出设备上“真实”绘制与显示。其中涉及到数字图像
动态翻译技术是一种把源指令集体系结构代码翻译成目标指令集体系结构代码的即时编译和优化技术。该技术在动态二进制翻译系统、动态二进制优化系统和高级语言虚拟机中已经得
二十一世纪以来,实时系统在军事、工业、商业等领域的应用越来越广泛,逐渐渗透到我们生活的各个角落,在一定程度上影响和改变着人们的生产及生活方式。与传统的计算机系统不同,实
非真实感绘制(Non-PhotorealisticRendering,简称NPR)技术是计算机图形学领域最热门的研究方向之一。NPR有着广泛的应用和巨大的市场前景,其绘制结果往往能带给人巨大的视觉冲
无线传感器网络(WirelessSensorNetwork,WSN)具有重要的研究价值和广阔的应用前景,被评为二十一世纪的重要技术之一。IPv6是下一代互联网的核心协议,目前因特网正在进行由IPv4
该文在综观国内外远程教育发展现状基础上,根据实验教学的特点,提出了远程教育中模拟实验的概念及重要性,从总体设计思想出发,对其进行了详细设计与分析,深入探讨了实现中的
半导体工艺技术的飞速发展使片上集成更大规模的硬件资源,芯片设计遇到了高功耗,性能极限,互连延迟等性能提升的瓶颈问题。NoC(片上网络)的设计架构的出现,使得从基于计算的设计转
近年来,网络技术已经广泛地应用到各个技术领域和整个社会的各个方面.许多高校都已经或正在组建自己的校园网.该设计以沈阳大学为代表,就校园网的总体规划谈了自己的看法和设
随着无线传感器网络(WSN)技术内涵的扩展以及物联网和泛在网概念的出现,“信息服务”而非“连接服务”将成为未来泛在信息社会的基本特征。作为物联网的感知延伸和物联网的信