论文部分内容阅读
传统的基于内容的图像相似检索技术在结果的准确率方面已经进入到一定瓶颈,如何通过图像的其它附属信息(如:描述、评论、作者以及各种属性)来增强相似搜索结果的准确性是本文的研究重点之一。我们将图像本身和它的描述文本以及各种属性的组合结构称之为图像对象。目前,针对图像对象的应用很多,例如:在传统的互联网相似图片搜索中,大部分新的技术采用图像的视觉特征与图像在网页中周围环绕的文本组合查询得到最相似的搜索结果;在美术作品的相似检索中,图像对象包含作品的作者、年代、画派和作品描述等属性。本文分析了其难点,并设计了相应的系统实现。
首先,对这些特征进行统一的处理与表达影响着最终系统的效率及效果。本文设计了一个统一的图像对象处理和相似度计算模型框架,对属性特征进行归纳分类总结。并根据系统的实际需求修改相应的查询函数,优化相似查询的效率。在特征权重选择方面,采用基于快速RankBoost算法框架的自适应权重选择方法。
其次,对于大规模数量的图像对象集合的有效管理也是难点之一。本文探讨了不同的索引结构之间的区别与共同点,采用了M-Tree作为主要的索引结构,并针对实际情况,设计了一种M-Tree的分布式方案。本文通过聚类预处理选取合适的中心点,用于索引的分片。同时,为了应对大规模数据,采用MapReduce实现聚类及索引创建的整个过程。使用增量索引的方法实现索引的插入,同时使用标记的方法实现索引的删除,以此来避免对主索引文件进行大量的修改操作。
最后,本文展示了一个采用图像对象相似检索技术的具体应用系统——“浙大图片搜索”,来对比通过基于文本、基于视觉特征、基于属性特征和基于图像对象在相似检索中的效果,并与通用搜索引擎中常用的“重排序”方法做对比。从而说明图像对象相似检索在实际应用中的支持能力。