论文部分内容阅读
近年来,随着网络应用的普及和手机拍照设备的发展,人们对数字媒体图像的使用需求越来越迫切,其中图像搜索是迫切的需求之一。在视觉检索领域,基于词汇包的倒排索引的研究越来越多,然而,视觉搜索中面临一个最基础的问题,即如何在单个服务器资源(CPU、内存、硬盘等)有限的条件下维持不断增大的索引的结构。为了解决大规模图像搜索中有关索引结构的问题,本文针对传统的索引架构的局限,提出了大规模图像数据集分布式搜索模型,并设计了相关的算法提升了分布式搜索系统的性能,对于视觉搜索的应用具有重要的意义。论文结合基于视觉特性的研究项目,首先,针对分布式视觉搜索系统中使用图像底层特征缺乏语义信息导致图像集合划分和选择不准的问题,通过将图像的底层特征空间转换为中层的潜在语义空间,使用潜在主题的分布来表达图像,提出了基于潜在主题的分布式视觉搜索算法。其次,针对分布式系统的子服务器被分配到的查询请求的数量不同导致子服务器间负载不均衡的问题,分析了单词的共生性等统计数据信息,通过机器学习将索引有效地分配到相应的服务器上,设计了一种基于单词共生性的索引分配算法。并通过实验验证了本文算法的优越性。最后,本文在千万的地标等图像库上,设计并实现了基于移动终端的分布式视觉搜索系统,进一步验证了本文算法的有效性。