论文部分内容阅读
随着计算机网络和多媒体技术的发展,每天产生大量的数字图像资源,因此如何对图像进行有效管理并建立高效的图像检索算法成为研究的重点。基于文本的图像检索实现简单,但人工标注耗时耗力,在使用上具有一定的局限性。基于内容的图像检索融合了计算机视觉技术、机器学习和信息检索技术,成为近十几年来图像检索研究的主流方向。词袋模型和词汇树算法作为其中重要的技术,处于不断发展和深入研究的阶段。本文分析了基于内容的图像检索算法的研究现状,对图像特征提取、海量数据高维索引这两个关键问题展开研究,并实现了基于词袋模型和词汇树的图像检索算法。该算法旨在提高图像检索算法的性能,在此基础上完成智慧城市街景图像检索原型系统的设计和实现。本文的主要研究工作如下:1.针对中小规模数据库,研究并实现基于词袋模型(Bag-of-Words,BoW)和支持向量机(Support Vector Machine,SVM)的图像检索算法。分析SIFT和SURF图像局部特征提取算法,并阐述BoW模型和SVM的原理。在不同大小数据库上,对图像分别提取SIFT特征和SURF特征,测试其训练速度、检索性能以及词袋大小和检索性能的关系,给出相应结论。2.研究基于词汇树(Vocabulary Tree)的图像检索算法,并在此基础上实现五万张图像的秒级检索。分析词汇树算法的原理和步骤,研究检索图像与数据库图像相似度分值的排序算法以及对大规模数据库训练的内存策略。采用KD-tree with BBF(Best Bin First)特征匹配算法和RANSAC(Random Sample Consensus,随机抽样一致性)去除错误匹配算法对词汇树返回的前N个检索结果进行排序筛选,有效提高检索精度。3.设计并实现智慧城市街景图像检索原型系统。为满足使用需求,系统设计为具有前后端的Client/Server架构,客户端和服务器端在同一WiFi无线局域网下通过HTTP协议进行通信。针对系统需求设计系统整体框架,并完成客户端和服务器端的具体模块实现。最后,对系统进行了测试。