图像和三维对象检索机制的研究

来源 :西安工业大学 | 被引量 : 0次 | 上传用户:xtipdx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,基于内容的视觉信息检索已经成为多媒体分析和理解中非常活跃的研究方向。在该领域的研究中,如何提取有效的特征对视觉信息的内容进行描述,以及如何设计合理的检索机制以得到用户满意的检索结果,是研究人员关注的重点问题。本文针对图像和三维对象的特征提取方式和检索机制展开研究,研究内容分为基于内容的图像检索和基于视图的三维对象检索,主要包括以下五部分:(1)首先,我们在理论上对基于内容的图像检索(CBIR)系统中存在的几种主流的特征提取方式进行了较为细致地分析,评定出各种方法的优缺点,然后在MATLAB平台上作出了一系列基于检索效果的测试,对当今CBIR系统主流的几种检索方式进行相互比对的实验分析。(2)针对当前CBIR系统检索方式单一的问题,我们提出了运用手绘图检索的新方法,这种具有形式灵活、贴近高层语义的诸多优势检索的优势,具有较强的应用价值。(3)由于Zernike可以任意构建高阶矩,在目前的图像检索领域中是应用最为广泛的一种形状描述子。所以在三维对象检索领域中,考虑到三维对象的语义部分具有的高频特点,我们提出利用Zernike矩去描述一幅三维对象的底层视觉特征。(4)在使用Zernike矩描述图像内容的基础上,提出了一种能够描述三维对象之间的距离度量机制。该距离即考虑了不同三维对象的整体特性,又考虑了不同对象视图之间的匹配关系。实验结果表明基于该距离的度量机制在三维对象的检索中取得了比较好的检索结果。(5)在三维对象的检索系统中,提出了一种引入相关反馈的分类器学习算法。该算法通过用户对系统的使用过程,在多次检索中积累用户标注的信息,自适应地提取图像的语义内容知识,在以后用户的查询过程中,将底层视觉特征信息与相关反馈学习机制结合起来对三维对象进行检索。我们以目前CBIR领域中比较通用的台湾大学数据图库为实验平台,对所提出的算法进行了大量的示例和统计实验。一些实验结果表明,在算法中融合了反馈学习机制后,系统的检索性能能够有较大幅度的提升。
其他文献
本文设计了一种数据测量记录系统,由USB微控制器和FPGA搭建的数据采集板完成对惯性导航产品输出信号的采集,利用USB接口与上位机进行数据传输。论文首先介绍了USB的发展及其
无线mesh网络能给移动用户提供“最后一英里”的宽带无线接入,是下一代无线移动网络中非常有前途的通信技术。而有效的信道资源分配对提高无线mesh网络容量等性能指标具有重
在嵌入式图形用户界面(GUI)系统中,用户输入是人机交互的基础。用户输入模块的功能需求包括两个方面:第一,支持多种输入方式,如鼠标、键盘、红外遥控、软键盘等,以适应嵌入式
配电网络分布广泛,因此利用配电网来传输信息成为研究热点。但是电力线信道环境十分恶劣,使得配电网中信息的传输受到很大的影响。电力线信道中存在的噪声和各种衰减,都对配
非刚体三维运动重建主要研究从一组二维动态图像序列中提供的信息来恢复其三维结构矩阵和相机运动矩阵。早期的研究是在因式分解基础上对观测矩阵进行分解,结合线性组合表示
由于无线通信技术的快速发展以及对无线通信需求的增大,频谱资源如同其他不可再生资源一样越来越稀缺,已成为无线通信发展的巨大瓶颈。但是经过大量科研人员的研究却表明目前
本文设计了一种以单片机和FPGA为核心,可以对惯导组件输出的脉冲进行实时采集、处理的检测系统。利用串口与上位机进行数据传输,使用VHDL语言对FPGA芯片内部电路进行设计,具
图像Hash技术将图像数据映射为一个可反映图像重要视觉特征的简短二值序列,目前在内容认证、数字水印和图像数据库检索等领域有广泛应用。本文对图像Hash认证技术中的一些重要
X射线血管造影和血管内超声(IVUS)是目前临床普遍采用的诊断血管病变的介入性影像手段,二者具有优势与不足互补的特点。本文提出一种基于血管造影和IVUS图像融合的血管三维重