分布式索引在大规模视觉搜索中的研究与应用

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 4次 | 上传用户:dengwj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着网络应用的普及和手机拍照设备的发展,人们对数字媒体图像的使用需求越来越迫切,其中图像搜索是迫切的需求之一。在视觉检索领域,基于词汇包的倒排索引的研究越来越多,然而,视觉搜索中面临一个最基础的问题,即如何在单个服务器资源(CPU、内存、硬盘等)有限的条件下维持不断增大的索引的结构。为了解决大规模图像搜索中有关索引结构的问题,本文针对传统的索引架构的局限,提出了大规模图像数据集分布式搜索模型,并设计了相关的算法提升了分布式搜索系统的性能,对于视觉搜索的应用具有重要的意义。论文结合基于视觉特性的研究项目,首先,针对分布式视觉搜索系统中使用图像底层特征缺乏语义信息导致图像集合划分和选择不准的问题,通过将图像的底层特征空间转换为中层的潜在语义空间,使用潜在主题的分布来表达图像,提出了基于潜在主题的分布式视觉搜索算法。其次,针对分布式系统的子服务器被分配到的查询请求的数量不同导致子服务器间负载不均衡的问题,分析了单词的共生性等统计数据信息,通过机器学习将索引有效地分配到相应的服务器上,设计了一种基于单词共生性的索引分配算法。并通过实验验证了本文算法的优越性。最后,本文在千万的地标等图像库上,设计并实现了基于移动终端的分布式视觉搜索系统,进一步验证了本文算法的有效性。
其他文献
单篇科研文献文档摘要自动生成在信息检索中具有重要意义,可以为大规模信息检索提供简要信息提示。无监督抽取式摘要生成是文本摘要研究的重要任务,旨在从原文中依据各种文本语
应用程序对计算机硬件特别是处理器的性能要求越来越高,尽管32位处理器还在使用,但64位处理器已经越来越多的受到人们的关注。相对于32位处理器,64位处理器能直接进行64位的整点
微博的兴起使其成为个人情绪表达的重要虚拟场所,微博上产生了大量富有情绪的内容。对微博进行情绪分析,可以了解到社会舆情、情绪倾向等,针对社交短文本的情绪分析不断受到相关
近些年来,P2P技术发展迅猛,得到广泛的应用。比较有代表性的有BitTorrent、eMule等文件共享类应用和QQLive、PPTV等P2P流媒体应用。P2P流媒体技术发展迅速,用户规模增长很快。P2
近年来,由于计算机、通信技术的飞速发展,空间信息技术得到了极大的提高。日常生活中人们对空间信息的需求日益增长,空间信息具有非结构化、多比例尺、关系复杂、随时间变化及数
随着计算机支持的协同工作技术的成熟和移动终端设备的不断发展,越来越多的人从传统的工作方式向移动办公的方式转变,人们不再局限于固定地点办公,移动CSCW(ComputerSupportedCoo
近年来,随着互联网上图像的急剧增长,基于内容的图像检索(Content BasedImage Retrieval)一直是多媒体内容检索领域的研究热点。按其使用的特征类型划分,它已经历从传统全局特征
随着部队信息化程度的提高,基层连队管理工作已逐步纳入了连队信息化建设的重要议程,基层连队武器装备信息化管理直接关系着基层连队信息化建设的进程。而现有的基层连队武器装
随着物联网的飞速发展,物端系统中主控芯片的选择成了大家所关注的热点,人们既希望主控芯片具有较高的性能,能够处理复杂的数据运算,又希望其功耗能够尽量降低。因物端设备需时刻
图像在人们的日常生活和信息交流中有着十分重要的意义。特别是随着互联网设备如笔记本、手机和平板电脑等越来越普及,图像的数量呈现爆炸式增长,与此同时图像的内容也越来越多