基于词袋模型和词汇树的图像检索技术研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户：bushliu

【摘要】

：

随着计算机网络和多媒体技术的发展,每天产生大量的数字图像资源,因此如何对图像进行有效管理并建立高效的图像检索算法成为研究的重点。基于文本的图像检索实现简单,但人工

【作者】

：

黄韵

【机构】

：

西安电子科技大学

【出处】

：

西安电子科技大学

【发表日期】

：

2014年期

【关键词】

：

图像检索 BoW SVM 词汇树 KD-tree

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着计算机网络和多媒体技术的发展,每天产生大量的数字图像资源,因此如何对图像进行有效管理并建立高效的图像检索算法成为研究的重点。基于文本的图像检索实现简单,但人工标注耗时耗力,在使用上具有一定的局限性。基于内容的图像检索融合了计算机视觉技术、机器学习和信息检索技术,成为近十几年来图像检索研究的主流方向。词袋模型和词汇树算法作为其中重要的技术,处于不断发展和深入研究的阶段。本文分析了基于内容的图像检索算法的研究现状,对图像特征提取、海量数据高维索引这两个关键问题展开研究,并实现了基于词袋模型和词汇树的图像检索算法。该算法旨在提高图像检索算法的性能,在此基础上完成智慧城市街景图像检索原型系统的设计和实现。本文的主要研究工作如下:1.针对中小规模数据库,研究并实现基于词袋模型(Bag-of-Words,BoW)和支持向量机(Support Vector Machine,SVM)的图像检索算法。分析SIFT和SURF图像局部特征提取算法,并阐述BoW模型和SVM的原理。在不同大小数据库上,对图像分别提取SIFT特征和SURF特征,测试其训练速度、检索性能以及词袋大小和检索性能的关系,给出相应结论。2.研究基于词汇树(Vocabulary Tree)的图像检索算法,并在此基础上实现五万张图像的秒级检索。分析词汇树算法的原理和步骤,研究检索图像与数据库图像相似度分值的排序算法以及对大规模数据库训练的内存策略。采用KD-tree with BBF(Best Bin First)特征匹配算法和RANSAC(Random Sample Consensus,随机抽样一致性)去除错误匹配算法对词汇树返回的前N个检索结果进行排序筛选,有效提高检索精度。3.设计并实现智慧城市街景图像检索原型系统。为满足使用需求,系统设计为具有前后端的Client/Server架构,客户端和服务器端在同一WiFi无线局域网下通过HTTP协议进行通信。针对系统需求设计系统整体框架,并完成客户端和服务器端的具体模块实现。最后,对系统进行了测试。

其他文献

IP多媒体子系统中的接入安全机制研究

本文首先介绍现代密码学的基础知识，并深入分析了已在IMS应用的PKI技术，以及IPSec和TLS(SSL)两种网络安全协议，总结了它们的技术特点。然后深入剖析了目前3GPP制定的IMS安全机制

学位

网络协议多媒体子系统接入安全机制运输层安全预共享密钥

天线选择算法研究及其在合作分集无线网络中的应用

MIMO技术、空时编码技术及合作分集技术可以充分利用空间域和时间域,提供更大的信道容量、更高的编码增益和分集增益。在无线通信系统中使用大量天线不易实现,本文以降低系统

学位

MIMO容量空时编码合作分集

基于CAN总线的智能调光监控系统

调光系统是电视演播室、舞台等处灯光系统的指挥中心,其设计是否合理、可靠,影响重大。可操作性更强,更加注重设备间的相互协调与大量信息的传送,数字化、智能化、电脑化、网

学位

CAN总线智能调光监控系统TMS320LF2407A

WCDMA系统软切换算法分析与仿真

软切换作为无线资源管理(RRM)中最重要的技术之一,开始运用于CDMA系统,在移动通信发展到3G时代得到了更广泛的应用。本文重点研究了WCDMA系统的软切换技术,首先对WCDMA系统软

学位

WCDMA软切换算法仿真

基于双线性对的数字签名的安全性研究

在信息技术日益发展的今天,我们享受着它给我们带来高效率、高效益和高质量的生活,与此同时也承受着它给我们带来了前所未有的威胁!信息的数字化导致其很容易遭受窃听、截取

学位

数字签名信息安全电子商务电子政务密码算法密钥管理

应用于小麦克风阵列技术的Sigma-Delta模数及数摸转换器数字电路部分的设计与实现

麦克风阵列技术，可通过声波到达麦克风阵列中各个麦克风的延时和遮挡输出,产生时域波束(Beamforming)，将某个区域内的声源作为有用信号,而区域外的声源都作为噪声抑制掉。从而

学位

麦克风阵列技术Sigma-Delta模数数摸转换器CMOS工艺数字电路

基于H.264的流媒体安全压缩算法研究

随着流媒体技术的更新发展,它的安全问题越来越受到重视。鉴于媒体流数据存储和传输的广泛性和便易性以及数据量巨大等特点,如何设计一种高效、快速、稳定的加密算法已成为当

学位

流媒体H.264压缩加密运动矢量帧内预测帧间预测

三维地震数据可视化研究

在地球物理与信息技术领域，科学可视化技术将科学计算中产生的大量非直观的、抽象的或者不可视的数据，以图形图像的形式直观、形象地表达出来，可为下一步的数据解释分析提供有力

学位

科学可视化OpenGL直接体绘制三维地震数据场

图像检索在电力系统设备管理中的应用研究

本文深入分析和研究了基于内容图像检索领域的一些关键技术,如:颜色、形状、纹理等底层图像特征的描述,图像间的相似性度量准则以及相关反馈,并把它们应用于电力设备图像的检

学位

CBIR图像检索电力设备图像形状特征不变矩

基于红外图像的水面溢油检测及系统实现

随着经济的不断发展,运输石油类产品的船舶越来越多,随之而来的水面溢油事故的可能性越来越大。因此,如何及时有效地监测溢油事故的发生成为了人们急需解决的问题。基于红外

学位

溢油检测DSP图像去噪图像分割

基于词袋模型和词汇树的图像检索技术研究

与本文相关的学术论文