一种图像对象相似检索系统的设计与应用

来源 :浙江大学 | 被引量 : 0次 | 上传用户:chrisliuyaqin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的基于内容的图像相似检索技术在结果的准确率方面已经进入到一定瓶颈,如何通过图像的其它附属信息(如:描述、评论、作者以及各种属性)来增强相似搜索结果的准确性是本文的研究重点之一。我们将图像本身和它的描述文本以及各种属性的组合结构称之为图像对象。目前,针对图像对象的应用很多,例如:在传统的互联网相似图片搜索中,大部分新的技术采用图像的视觉特征与图像在网页中周围环绕的文本组合查询得到最相似的搜索结果;在美术作品的相似检索中,图像对象包含作品的作者、年代、画派和作品描述等属性。本文分析了其难点,并设计了相应的系统实现。   首先,对这些特征进行统一的处理与表达影响着最终系统的效率及效果。本文设计了一个统一的图像对象处理和相似度计算模型框架,对属性特征进行归纳分类总结。并根据系统的实际需求修改相应的查询函数,优化相似查询的效率。在特征权重选择方面,采用基于快速RankBoost算法框架的自适应权重选择方法。   其次,对于大规模数量的图像对象集合的有效管理也是难点之一。本文探讨了不同的索引结构之间的区别与共同点,采用了M-Tree作为主要的索引结构,并针对实际情况,设计了一种M-Tree的分布式方案。本文通过聚类预处理选取合适的中心点,用于索引的分片。同时,为了应对大规模数据,采用MapReduce实现聚类及索引创建的整个过程。使用增量索引的方法实现索引的插入,同时使用标记的方法实现索引的删除,以此来避免对主索引文件进行大量的修改操作。   最后,本文展示了一个采用图像对象相似检索技术的具体应用系统——“浙大图片搜索”,来对比通过基于文本、基于视觉特征、基于属性特征和基于图像对象在相似检索中的效果,并与通用搜索引擎中常用的“重排序”方法做对比。从而说明图像对象相似检索在实际应用中的支持能力。
其他文献
生物式水质监测是水质监测领域一个十分重要的研究课题。生物式水质监测技术和传统的理化水质监测技术相比,具有反应灵敏度高、成本低、直观性和综合分析代表性强的优点,在近
查询处理技术是无线传感器网络研究的核心,而近年来随着无线传感器网络技术的发展与成熟,日益严重的隐私问题已经逐步成为制约无线传感器网络查询处理技术研究的瓶颈问题。因此
近年来,数据中心(Data Center)的高速发展和和Mapreduce/Hadoop框架的日益重要,云提供商把越来越多的大数据放到云系统中处理。在现代基于虚拟化的数据中心上,虚拟机分配是实
正电子发射断层(PET)是一种无创的能够再现体内生物分布的分子成像技术,是现代生物医学成像中最高层次的成像技术之一,在临床诊断、生物医学研究和癌症普查等方面有重大意义
本文主要是针对当前基于时间序列模型的集成产品在实际应用中灵活性差、模型软件复杂难以维护、模型缺乏对分布环境的支持、不支持超大规模模型集成计算等缺点,提出了分布式的
随着计算机网络和数据库技术的飞速发展,数据和信息呈现出了一些新的特征:第一,积累的速度更加快速、更新的频率更加频繁;第二,数据和信息的规模越来越庞大;第三,数据分布的范围
自动指纹识别技术是目前生物特征识别中最典型、应用最广泛的技术,有着其他手段不可比拟的优越性。它大致包括指纹图像预处理(增强和锐化、二值化、细化)、特征提取和特征匹
在未来战争中,多主体协同作战是发展的必然趋势,在多主体协同工作系统中资源调度算法是核心。论文首先从协同系统的角度对多主体协同作战资源调度问题的关键要素进行了分析,根据
科技项目评价是指按照规范的程序和公允的标准对科技项目进行的评判活动。科技项目在我国科技资源配置中占较大的份额,项目的立项、研究过程及最终成果直接影响和推动着科学
随着摄影、照相等相关硬件技术的不断发展,在电影、游戏、医疗等领域,三维技术得到了广泛的应用。相比于二维图像,三维图像具有更多的空间信息且贴近人们的生活。近年来,在计算机