全局与局部特征融合的大规模图像检索方法

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:tommy0229
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据时代下,随着互联网中大规模图像数据库越来越多,如何使用户快速的在海量、动态的数据库中找到满足需求的图像是现今视觉领域的重要课题。其中,最主要的应用是基于内容的图像检索,即输入查询图像,在线查询相似的图像结果。最经典的图像检索系统是基于以SIFT为代表的手工局部特征建立倒排索引,但其局部底层特征与全局语义间存在着严重的‘语义鸿沟’,准确率无法得到突破。在带有语义特性的CNN深度特征出现后,虽然在图像检索尝试中有着不错表现,但仅使用深度特征作为图像表达无法针对细节纹理进一步区别图像达到理想精度。所以,如何结合两种特征特性,互为补充描述图像,突破现有特征表达局限,并以此建立可以快速查询的索引结构,提高图像检索系统查询准确率,仍是迫切需要解决的一大挑战。本文尝试结合图像全局与局部特征,提出对融合特征进行二维倒排索引的方案,同时,在相似性匹配阶段优化特征向量的权值估计,提高图像检索系统的查询准确率,解决图像检索。主要贡献如下:全局与局部特征相结合二维倒排索引模型。首先使用统一尺度空间下的分块模型,以分块Patch作为图像的视觉词单元,应用具有细节纹理特性SIFT特征以及具有语义特性的CNN特征作为视觉词组合表示。与一维倒排索引应用词袋模型类似,本文是对两个特征向量空间进行聚类划分,则视觉单词索引键值是两个空间特征码词的组合,由此使得在索引阶段就对视觉词进行了更精细的划分,在离线训练时就大量排除了错误匹配,索引列表中的图像将是全局与局部特征都一致的相似组合,提升了检索系统的准确率。考虑词频分布与主题相关性优化视觉单词的权值估计。在图像检索系统的比较中发现,常被使用的经典IDF计算由于忽略词频分布的影响,因此放大了偶尔出现的噪声影响,弱化了词频不同的视觉单词的区分力。优化的权值估计恰恰避免了这一问题,同时,本文应用主题模型求解视觉单词与主题相关性,并提高与主题强相关的视觉单词的重要性程度。本文还结合了二维索引结构特点,提出Multi-IDF计算框架作权值估算,整体提高视觉单词在相似性匹配中的区分能力,有效提升匹配精度。本文提出的结合全局与局部特征的二维倒排索引检索方案,有效提高了图像检索系统的查询准确率,同时在系统实践中也应用了HE二进制编码、MA多分配查询策略来保证系统的查询效率和召回率。本文在公开真实的大规模图像数据库上进行了系统实现,结果分析比较中进一步验证了所提方案的优势。
其他文献
如今我们的工作生活已经离不开移动通信网络,各种移动终端产品充斥着生活的每个角落。移动通信技术的发展速度比我们想象的要快得多。同时大家对移动通信的需求,不管是从需求
目前,我国已成为世界上电梯保有量最大的国家。电梯销售是一个周期长、专业度高且要求严格的工作,销售过程中存在着较高的复杂度和风险。因此,如何利用移动平台的优势和信息
在波分复用光网路(WDM)中,复用/解复用,上/下路,组播,交换,波长互换都能增加网络的灵活性与鲁棒性。波长互换能有效利用网络资源,提高网络性能,正向着更快的响应速度、调制格
转化型抢劫罪不是一种独立的罪名,而是法律拟制的条款,仅为法学理论上的称谓。同抢劫罪一样,不仅侵犯了他人的财产权利和人身权利,还对社会风气产生极其不良的影响和危害。其
在当今的通信网络中,信号的传输主要依靠光纤完成。但是信号的处理,还是主要依靠电来完成,这样就增大了传输成本,也降低了传输效率。全光信号处理技术可以在光域直接对光信号
随着近年来云存储的发展,越来越多的企业与个人开始认识并使用云存储。由于云存储服务提供商不完全可信,云存储的安全性一直是各界关注的焦点,也成为云存储能否大力发展的关
我国劳动教养制度的实施已近六十载,期间,适用劳动教养制度的收容对象数量一直趋于稳定。而今,在劳动教养制度面临废、改情势下更需要多方面的研究,尤其是实证分析。本文以甘
自从云计算平台提出以来,它的高存储性和高运算性能成功地解决了大数据时代带来的问题。然而,因为用户把数据远程的存储在云端,失去了对数据信息的控制能力,所以云端数据的完
尽管说话人识别系统在识别结果上已经取得了令人满意的结果,但是随着人口规模的不断增大,传统的GMM模型的识别时间也越来越长,识别速度慢将大大限制说话人识别系统的实用性。
党的十九届五中全会明确提出:"坚持创新在我国现代化建设全局中的核心地位,把科技自立自强作为国家发展的战略支撑,面向世界科技前沿、面向经济主战场、面向国家重大需求、面