面向复杂场景的图像深度哈希学习方法研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:shlpsfs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展以及网络社交平台的普及,互联网上出现了海量的图像数据,对这些图像数据的快速检索是互联网相关产业的核心任务之一。哈希学习是图像快速检索的重要方法,因其良好的性能,近年来引起了研究者的广泛关注。基于哈希学习的图像检索方法通过将图像数据映射为具有固定长度的离散二进制码,可以实现高效率、低存储的图像近似近邻检索。但是,随着图像采集设备软硬件技术的发展,海量的图像数据在满足用户需求的同时,也产生了大量的复杂场景图像(包含难以区分的背景或多个实体)。与一般图像相比,复杂场景图像对基于哈希学习的检索方法提出了更高的要求。针对复杂场景图像,在哈希学习的研究中主要有两种解决思路:(1)构造更有效的特征提取器,提取出包含更多图像信息的特征用于生成二进制的哈希码,以提高哈希码对复杂场景图像的表征能力;(2)设计更有效的目标函数,以指导哈希码向更优的分布方向优化,来增强哈希码对复杂场景图像的判别能力。基于以上两种思路,本文分别提出了基于细节感知的复杂场景图像深度哈希学习方法和基于困难样本挖掘的复杂场景图像深度哈希学习方法。(1)在特征提取器构造方面,要提取更多的图像信息,就需要对图像的细节信息进行更为深入的挖掘。现有的图像深度哈希学习方法多是直接为整幅图像生成哈希码,但这很容易造成对图像的局部细节信息的忽视,从而降低了复杂场景图像的哈希码的表征能力。为此,本文提出了基于细节感知的复杂场景图像深度哈希学习方法,以现有的深度网络模型作为基网络来构造新的网络模型,使网络能够为图像的局部区域生成近似哈希码的表示,然后再将它们融合成全局的哈希表示。在此基础上,该方法还使用同一图像的相互重叠的局部区域作为相似样本对,这样一方面可以缓解基于成对样本的哈希学习方法中固有的类别不平衡的问题,另一方面可以优化哈希码的分布。在三个公开的数据集上进行的详尽实验验证了该方法的有效性。(2)在目标函数设计方面,更优的哈希码分布可以使得复杂场景图像在哈希码分布中更易于区分,这需要设计新的目标函数来提高对复杂场景图像的关注度,进而来优化哈希码分布。为此,本文通过在训练过程中降低简单图像的权重,并给予复杂场景图像更高的权重,以提升哈希学习方法对复杂场景图像的检索能力,这一需求与困难样本挖掘(Hard Sample Mining)的思想有相似之处。因此,本文提出了基于困难样本挖掘的复杂场景图像深度哈希学习方法,引入困难样本挖掘函数,并在这基础上结合哈希检索任务的特点(即正负样本的实际相似度与检索时认定的相似度不一致)进行适应性的改进,以更符合哈希检索任务的需求。在三个公开的数据集上的实验结果验证了该方法的优越性。
其他文献
目前,医疗健康进入大数据时代,很多医疗记录被电子化、数字化存储。随着大众对医疗健康水平要求的不断提高,医疗检查与检查报告的质量受到普遍关注,是科学医疗诊断决策的重要依据。但是医疗检查报告的生成是一项非常复杂且繁琐的工作。为了保证报告内容是对医疗检查过程的完整、准确和规范的记录,需要对检查项目、检查内容和检查方法等使用标准医学术语进行规范记录。然而目前检查报告基本都是在检查结束后,由负责检查的医生完
公共预算作为提供公共产品和服务的最重要的政策手段之一,历来受到政府和相关部门的高度重视。1999年开始的部门预算改革,将部门预算方式由自上而下改为自下而上,全面推行国库集中收付制度和政府采购制度,将政府各项资金纳入全口径预算,在各级地方政府建立了以控制为主要取向的预算制度。部门预算改革不仅是上述技术性的改革,其本质是政治性的改革,将改革前各个支出部门的预算权力集中到了财政部门手中,从而实现了财政部
网络规模日益庞大,网络基础设施愈加复杂,一系列网络安全问题随之凸显。不法分子通过安全漏洞侵入网络进行恶意攻击并传播病毒,造成服务器崩溃和网络瘫痪,给企业造成巨大的经济损失。在这种情况下,流量测量变得十分必要。网络流量测量在交换机等网络转发设备上对数据包进行统计和分析,实时收集流量特征既能够检测出潜在的网络安全威胁,维护网络稳定,还可以为网络性能诊断、拥塞控制、负载均衡、网络计费等网络功能提供重要信
图像的分辨率是指图像区域内像素点的数目,代表图像信息的存储量。日常生活中,由于采集环境和设备的限制或数据传输的要求,大量有价值的图像,以含有低信息量的低分辨率形式存在。而单幅图像超分辨率算法,就是使用数字图像处理技术,由一幅低分辨率图像自身,重建出包含更多图像信息和细节的高分辨率图像,最终满足生产和生活的需要。因其在医学成像、卫星遥感影像以及监控系统等领域的广泛应用,单幅图像超分辨算法一直是图像处
超像素分割作为重要的图像预处理操作在图像处理和图形学中有着广泛的应用,例如图像分割、显著性检测、目标轮廓提取、图像压缩等。边界的贴合性和形状的规整性是评价算法的主要指标,这两个评价指标很难同时兼顾,大多数分割方法更加重视边界分割准确性而忽视了超像素的紧凑性。传统的基于像素点的分割方法需要对每一个像素点进行分析和聚类,所以生成的每一个区域的边界贴合性很好。因为其边界是锯齿状的,这些超像素方法在一些视
深度神经网络的高效推断过程通常需要高性能计算设备,但在资源受限的移动端或嵌入式实时系统中难以推广。神经网络剪枝技术通过减少网络连接的数量,能降低网络的复杂度,推动神经网络在计算资源受限条件下的应用。深度网络中冗余神经元剪枝算法取得了较大研究进展,但存在两个关键问题:1、目前的剪枝算法缺乏理论分析方法,无法对预先设置的剪枝比例给出合理的解释;2、基于全局剪枝比例的权值或神经元修剪可能会导致神经网络中
可穿戴外肢体机器人通过给人体安装额外独立的机械肢体,为穿戴者提供支撑负载等辅助功能,提高单人作业能力及作业范围。具有四个外肢体的多肢体机器人比单肢体和双肢体机器人的稳定性更好,可实现的任务模式更多,作业能力和作业效率也会有极大的提高,可广泛应用于工业、建筑、医疗、军事、航天等领域,具有极其广阔的发展前景。对多肢体机器人肢体和背板的建模及运动控制方法等方面进行研究分析可以促进多肢体机器人的实用化,具
随着深度学习、大数据等应用对计算机性能的要求逐渐提高,传统的基于CPU的架构已难以满足这些应用的计算需求,将CPU与作为加速器的GPU结合构成的异构多处理器片上系统(Heterogeneous Multiprocessor Systems-on-Chip,HMPSoC)成为主流趋势,GPU除擅长处理3D图像渲染外,还能进行大规模通用并行计算。在CPU-GPU异构架构中,高速缓存(Cache)是缩小
随着数据技术的发展,个性化推荐算法逐渐成为研究重点。在个性化推荐算法中,协同过滤方法使用最多。近年来,在机器学习的发展中,传统的协同过滤方法逐步与新技术结合,最近的一些工作开始应用深度学习方法,但主要是针对辅助信息进行建模。当要建模关键信息时,依旧使用矩阵分解的方法,用户和项目的隐含特征仍然用内积表示。因此,在嵌入过程中,对于互动中隐含的协同信号无法获得有效编码。在协同过滤中,用户和项目的嵌入表示
葛根是江西道地药材之一,在江西具有悠久的种植历史。作为药食两用价值极高的中药植物,葛根在江西的产业规模已初步形成,但发展却有所停滞。此文通过总结分析江西葛根的使用价值和产业现状,针对江西葛根产业目前发展存在的主要问题提出相关建议,旨在通过葛根发展战略制定、资源库构建、技术提升、相关保健产品重点研发、立体化生态产业建立等多种手段,促进葛产业的健康化、系统化及规模化发展。