海量近似重复图像检索研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:li9599
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网、数码相机(特别是具有拍照功能的智能手机)和图像编辑工具的快速发展和大规模普及,网络上的图片数量成爆炸式增长。如何在互联网上海量图像中找到用户所需要的图像或者跟图像绑定的其他信息,成为越来越重要和具有挑战性的问题。传统的图像检索大多使用基于文本检索的方法,而文字难以充分表达出图像中包含的丰富信息,而传统的基于内容的图像检索要么鲁棒性不够,检索效果不好,要么检索效率太差,都不能完全满足用户的需求。近十年来,一些优秀的局部特征(如SIFT)和词袋模型(bag-of-visual-words,BOW)的出现和发展,大大推动了基于内容的图像检索的发展。词袋模型特别适合大规模的近似重复图像检索。本文主要研究了基于词袋模型的海量图像检索技术,从SIFT特征、词袋模型和空间关系检查三个方面进行深入研究。在研究的基础上,本文设计并实现了一个海量近似重复图像检索原型系统。该系统在百万级的图像数据库上能够实现实时的图像检索,较为准确地返回图像数据库中与查询图像内容近似重复的图像。借鉴前人提出的一些空间关系检查算法,本文提出了一种新的空间关系检查方法,即强几何一致性(Strong Geometry Consistency, SGC)。该方法充分利用局部特征点的尺度、方向和位置信息对匹配的特征点对进行空间关系检查,快速而准确地滤除错误的匹配,在几个知名数据集上的实验表现优于当前一些主流的方法。本文还提出一种简单而有效的尺度加权(Scale Weighting,SW)方法.该方法根据局部特征点的尺度进行加权,能有效提高检索的效果。
其他文献
近年来,云计算得到了学术界和工业界的广泛关注,作为一种新颖的软件提供方式,软件即服务(SaaS)的模式正变得日渐流行。随着用户个性化多样化需求越来越多,面向多租户的网络应
随着Web应用的蓬勃发展,现实世界中存在大量的对象,它们相互之间存在各种各样的交互关系,形成一个庞大的、相互联系的复杂网络,我们称这个网络为信息网络。现实中,信息网络无
随着计算机技术和互联网的迅猛发展,“三网融合”的发展趋势日益明朗。人们对网络传输数据需求的越来越多样化,使得分组交换网络的负载急剧增加,互联网正面临着十分严重的技
绝大部分的应用系统都会提供对自身运行状况进行监控的功能,以方便用户更加深入和全面地了解系统的性能和当前的健康情况。提供这种功能的代码模块我们称之为性能监控系统。 
近几十年来,多媒体技术得到了飞速的发展,人们对交互式的音视频服务的需求也日益提高,这也推动了视频对象分割技术的进步。到目前为止,已经有近千种的分割算法,并且新的理论
随着时延容忍网络在现实生活中不断得到应用,其主流路由策略设计不足导致的性能瓶颈日益突出。理想的路由策略应该在能耗较低的前提下使时延容忍网络的传输性能达到最优,然而
动物机器人在运动的灵活性、能源供给、环境适应性等方面相比传统机器人具有很大的优势,在环境侦查和灾难搜救等方面的应用前景十分广阔,然而现实中将动物机器人用于未知环境探
随着电子纸显示技术的推广与应用,我们对电子纸已不再陌生,电子纸不仅是一种纸的替代品,而且是具有很大发展潜力的未来显示设备,电子纸显示技术分为很多类型,目前市面上最具代表性
随着科技日新月异的进步,各种各样的数据充斥着生产生活的各个领域,如何有效地获取数据中的精华并运用到各行各业中去,成为科研人员关注的焦点。基于这一实际需求,数据挖掘技术应
随着计算机技术的不断发展,社会环境的日益复杂,日常生活中对于安全的需求越来越高。人脸识别技术作为日益成熟的生物特征识别技术,通过比较人脸的生物特征信息来对身份加以