论文部分内容阅读
近年来,基于内容的视觉信息检索已经成为多媒体分析和理解中非常活跃的研究方向。在该领域的研究中,如何提取有效的特征对视觉信息的内容进行描述,以及如何设计合理的检索机制以得到用户满意的检索结果,是研究人员关注的重点问题。本文针对图像和三维对象的特征提取方式和检索机制展开研究,研究内容分为基于内容的图像检索和基于视图的三维对象检索,主要包括以下五部分:(1)首先,我们在理论上对基于内容的图像检索(CBIR)系统中存在的几种主流的特征提取方式进行了较为细致地分析,评定出各种方法的优缺点,然后在MATLAB平台上作出了一系列基于检索效果的测试,对当今CBIR系统主流的几种检索方式进行相互比对的实验分析。(2)针对当前CBIR系统检索方式单一的问题,我们提出了运用手绘图检索的新方法,这种具有形式灵活、贴近高层语义的诸多优势检索的优势,具有较强的应用价值。(3)由于Zernike可以任意构建高阶矩,在目前的图像检索领域中是应用最为广泛的一种形状描述子。所以在三维对象检索领域中,考虑到三维对象的语义部分具有的高频特点,我们提出利用Zernike矩去描述一幅三维对象的底层视觉特征。(4)在使用Zernike矩描述图像内容的基础上,提出了一种能够描述三维对象之间的距离度量机制。该距离即考虑了不同三维对象的整体特性,又考虑了不同对象视图之间的匹配关系。实验结果表明基于该距离的度量机制在三维对象的检索中取得了比较好的检索结果。(5)在三维对象的检索系统中,提出了一种引入相关反馈的分类器学习算法。该算法通过用户对系统的使用过程,在多次检索中积累用户标注的信息,自适应地提取图像的语义内容知识,在以后用户的查询过程中,将底层视觉特征信息与相关反馈学习机制结合起来对三维对象进行检索。我们以目前CBIR领域中比较通用的台湾大学数据图库为实验平台,对所提出的算法进行了大量的示例和统计实验。一些实验结果表明,在算法中融合了反馈学习机制后,系统的检索性能能够有较大幅度的提升。