基于分布式计算的百万数量级相似图像搜索引擎

被引量 : 0次 | 上传用户:gamebugs2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文将基于内容的图像检索理论与分布式计算技术相结合,讨论百万数量级的相似图像搜索引擎的构建。首先,本文研究基于内容的图像检索领域中相似图像检索的具体问题,并将相似图像定义为两类:整体相似图像,例如构图结构相似,或同一内容不同大小、不同质量的图像;局部相似图像,例如出现了相同物体、相同场景或相同人物的一组图像。针对两种不同类型的相似图像,分别采用图像全局特征——Haar小波分解特征和图像局部特征——SIFT特征来进行处理。其次,本文的目标是构建百万数量级以上的大规模图像搜索引擎,系统中存储与待匹配的图像特征超过10亿。针对海量高维图像特征向量的匹配效率问题,本文研究了各种不同类型算法的优劣,并选择局部敏感哈希(Locality Sensitive Hashing, LSH)算法作为索引和匹配图像特征的方法,讨论了与本问题相适应的局部敏感哈希算法的参数选择以及系统实现策略。另一方面,针对系统中海量的图像与图像特征数据的存储与计算问题,本文跳出一般图像检索研究中的局限,采用分布式存储与计算的方法解决大规模数据的存储与计算问题。本系统实现了Windows平台下一个轻量级的分布式文件系统,并基于该文件系统实现了图像特征提取、索引和检索匹配等计算的分布式并行化。实验证明,本系统的设计能成功工作在百万数量级的图像库上,并且在实际应用中能成功且高效的处理用户的相似图像查询。关键词:基于内容的图像检索,搜索引擎,分布式计算,分布式文件系统,图
其他文献
信息技术和互联网的迅速发展,使得技术创新形态正在逐步发生转变,以用户为中心、以人为本的思想进一步受到重视。界面作为信息产品的窗口,其设计从之前追求满足用户的功能需
中国南海北部大陆坡具有良好的天然气水合物(以下简称水合物)资源前景,但目前还没有针对海洋水合物藏开采潜力的地质评价指标,无法对水合物藏进行简单高效的开采潜力评价预测
本文对财务工作在管理中的应用进行多个方面阐述,对财务本身基础工作对公司管理的应用中的财务对公司费用的支付管理,财务对公司收款工作的管理财务对成本的核算,财务对公司
随着社会经济的发展,旅游业这一朝阳产业成为了本世纪第一大产业,同时它也是节约资源保护环境的可持续发展的产业,是现代经济社会发展的巨大引擎。婺源县具有丰富的旅游资源,
<正>Peabody运动发育量表(Peabody development measure scale,PDMS)是目前在国内外康复界和儿童早期干预领域中被广泛应用的一个专门的运动功能评估量表,该量表不仅可用于运
会议
目的:采用环糊精包合技术将香附四物汤中具有显著活性的挥发油部位制成β-环糊精包合物,以解决香附四物汤新型口服制剂研发过程中挥发油存在的挥发性与不稳定性等问题。方法:
轮轴过盈配合面的微动损伤常常导致车轴产生裂纹甚至断裂,为了避免以往用高压退轮的方法带来的2次损伤,采用原位剖切的方法,将车轴与轮毂配合分离来观察分析轮座表面损伤的基
砾石戈壁是西北干旱荒漠区的一个重要土壤类型,其土壤含量少、瘠薄、肥力差,导致造林成活率较低,常规造林方式是换土,但造林成本高、投入大,给造林工作带来诸多困难。本文通
针对本土民间游戏在幼儿园被边缘化的现实,文章以广西柳江县本土民间游戏资源的开发为例,探讨融入民间游戏资源的新课程在目标设计、素材收集与内容编排等方面的特点及实施情
云南与越南、缅甸、老挝三国接壤,连接了中国、东南亚以及南亚三大市场,是中国与东南亚和南亚沟通的重要陆上通道。2009年7月,胡锦涛总书记考察云南时提出"建设面向西南开放