论文部分内容阅读
如今,随着软件和硬件的迅猛发展,图像已经成为人们记录信息的主流载体。相比于数字和文本而言,图像数据包含了更为丰富的信息,这些信息对于人类,更客观、语义层次更高,也更贴近现实。换言之,图像反映了真实世界中的场景、物体、物体与物体之间的关系。而对于机器而言,图像不过是以一定格式组织在一起的数据而已。那么,如何使机器能够理解图像的内容是使机器理解真实世界的关键问题之一。也正是因为这个原因,图像理解成为计算机视觉和模式识别领域中最基础最重要的主题之一。计算机对图像的理解,通常要从低层信息入手,挖掘图像中具有代表性的信息,进而组织信息。再通过寻找图像之间信息的对应性来探索更为高层的信息。这与人类认知的本质是极为一致的。图像的特征主要分为两类:全局图像特征和局部图像特征。全局图像特征关注于图像的整体信息,其优点是简单高效,但是它对图像的变换、噪音和遮挡十分敏感。局部图像特征则倾向于图像的细节,相比于全局图像特征,其优点在于它对图像的变换、噪音和遮挡等因素具有良好的鲁棒性,但是处理的时间会增加。随着硬件的快速更新以及现实任务的需求,局部图像特征已成为图像特征的主要研究对象。本论文从图像的视觉信息出发,对局部图像特征的描述、场景级别的准稠密匹配、物体级别的(准稠密)匹配及物体的协同分割几个方面开展研究。1)赋赋予予特特征征描描述述符符以以镜镜面面翻翻转转不不变变性性的的方方法法。。尽管国内外学者已经设计了很多图像特征描述的方法,这些方法能够有效的处理图像的缩放、旋转和视角等变换。但是,对镜面翻转的情况却鲜有研究。文中提出一种具有镜面翻转不变性的特征描述框架,赋予传统的特征描述符以镜面翻转的鲁棒性并保持了原有的特性及优势,包括平移、旋转和尺度不变性。我们并不是要设计一种全新的特征描述符,而是提出了一个框架能提供大多数特征描述符以翻转不变性。镜面翻转不变性的提出拓宽了特征描述的应用范围。2)加加入入三三角角形形几几何何约约束束的的特特征征匹匹配配方方法法。。获取了图像特征的描述,图像特征描述符的匹配是图像理解的另一关键之处。衡量特征匹配性能主要包括两个方面:1)正确匹配的数量和2)正确匹配的比率。正确匹配数量对三维重建等任务十分关键,而正确匹配率则是结果正确性的保证。根据不同的应用需求,传统的匹配方法通常以牺牲一方而获取另一方。这种此消彼长的模式限制了图像理解本身以及其应用的性能改善。本文提出了一种加入几何约束的特征匹配方法,即三角约束特征匹配,来同时提高这两个性能指标得到准稠密的、高精度的匹配结果,从而突破了长期以来存在的瓶颈。3)物物体体级级别别的的特特征征匹匹配配算算法法和和物物体体协协同同分分割割方方法法。。相比于像素和局部特征,物体是人类认知中更为有效的单元。为此,本文还开展了基于图像的特征描述符的匹配进而挖掘图像中的物体之间的关系。物体级别的匹配充分利用了匹配特征点对之间的尺度、旋转、空间关系及描述符相似度,在没有任何先验信息的情况下,有效的寻找物体之间的对应关系。由于图像的特征匹配是以点对的形式存在,很难覆盖物体的全部信息。为了克服这一困难,本文最后设计了一种协同分割的方法,提出对应物体的更多信息。本文以图像特征描述、图像特征匹配、物体特征匹配和协同分割为纵向主线依次进行描述。为了验证所提出的方法的有效性和鲁棒性,文中结合大量模拟数据和真实数据对相应方法的性能进行定性及定量分析。从实验结果中我们发现,所提出的方法相比于对比方法性能上有显著的提高。