论文部分内容阅读
随着移动互联网和数字媒体的普及,图像、视频数据逐步成为网络不可或缺的资源,对多媒体时代的海量图像有效存储和高效检索是我们当前面临的机遇和挑战。在这一挑战中图像哈希技术将高维数据映射成低维二进制哈希码是关键。哈希码的质量取决于图像哈希算法中哈希函数的设计和图像表征的有效性。基于人工提取的图像特征对图像的表征能力有限,在实际使用中结果并不理想。哈希函数的设计也很难适用于多个数据集。近年来,计算机视觉、深度学习迅猛发展,基于深度学习自动学习数据特征的方式逐渐代替原有的人工获取,实现了更智能更自动化的特征提取方式。将深度学习技术和哈希编码技术相结合是当前图像哈希技术的主流研究方向。在深度图像哈希技术中,寻找、探索更有效的卷积神经网络结构和优化算法是研究热点。根据国内外学者对深度学习图像哈希技术现状的研究和分析,本文主要对图像检索的深度图像哈希技术进行了分析和实验,工作如下:针对现存的以图搜图系统中自动化和智能化水平低、缺乏人工智能技术支撑、难以获取精确的检索结果、检索系统耗费计算机内存、实时性等难以满足多媒体时代下海量图像的检索需求。依据问题提出了一种多任务级联分层图像检索方法。首先利用选择性检索网络在特征图上进行逻辑回归得到图像中各感兴趣区域概率向量,在此基础上结合紧凑量化网络对其进行编码得到图像紧凑量化哈希码;其次利用再次筛选网络获取各感兴趣区域响应最大的区域感知语义特征;接着对每个感兴趣区域进行基于量化哈希矩阵的精检索策略对图像进行快速比对;最后选出与查询图像中的对应感兴趣区域最相似的图像。提出的多任务学习方法既能同时得到图像紧凑量化哈希码和区域感知语义特征,还能有效去除图像背景和其他对象信息的干扰。实验结果表明:本文方法能实现端到端的训练,自动选出更高质量的感兴趣区域特征提高了大规模图像检索智能化水平,检索精度(0.9478)与检索速度(0.306s)均明显优于现有大规模图像检索技术。针对已有车辆检索中缺乏智能化、检索结果无法满足实际需求等问题,提出了一种基于多任务网络,针对细粒度数据集提取图像的分段紧凑特征的卡口车辆检索技术,充分使用车辆图像的多样性与关联性完成道路卡口的在线检索。首先,结合相关任务中的联系改善检索系统精度,降低多标签特征之间的耦合,提出的多标签分段学习策略将语义特征和多标签相结合,获取车辆图像不同属性的二进制哈希码;随后利用最小化图像编码增强图像表征的鲁棒性;然后,采用特征金字塔网络图区车辆图像的实例特征;接着,设计局部敏感哈希再排序算法,对以上特征进行图像相似度匹配;最后,针对缺失或缺损检索车辆的特殊情况,使用跨模态方法辅助检索。在三个公开数据集上使用本章提出的检索方法,检索精度均优于目前主流的车辆检索算法。其中,CompCars车辆数据集的检索精为0.966。VehicleID中提升至0.862。该方法将最小化图像编码和图像实例特征融合获取了高精度高时效的检索结果,且在缺失或缺损车辆图像时可实现跨模态检索。