基于深度哈希的大规模图像检索方法研究

来源 :华中师范大学 | 被引量 : 3次 | 上传用户:wanglaow
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的到来,互联网图像资源迅猛增长,如何快速正确地从海量的图像数据中检索出用户所需的图像成为亟需解决的一大难题。在大规模图像检索的背景需求下,基于内容的图像检索技术利用图像自身的语义信息,摈弃以往繁杂的人工文本标注,提高了图像检索性能,但在基于内容的图像检索方法中,图像往往由高维的特征矢量表示,而这又带来了大规模图像特征存储量大,索引难等新问题。近年来,在大规模图像检索中引入哈希的检索方法得到了人们的广泛关注与研究。但它由于底层特征表达能力不强,量化特征矢量时产生的误差较大以及将哈希学习方法分为两步骤完成(先特征降维再量化得到哈希码)等问题,导致得到的哈希码区分性不强,陷入了局部最优问题,从而影响了图像检索的准确率。针对上述存在的问题,本文结合深度卷积神经网络VGG16与有监督哈希的优势,提出了基于深度哈希网络的大规模图像检索方法。本文的工作主要包括:(1)提出基于VGG16的深度哈希网络的图像检索方法。该方法采用在ImageNet数据集上预训练过的VGG16网络模型,对其进行微调来提取检索精度高的图像视觉特征。在VGG16网络中,本文设计了哈希层来替换其最后一个全连接层,使得特征矢量与哈希码同时学习并相互反馈促进,以及在该层利用非线性函数Tanh,限制其输出。同时为了确保学习到的哈希码质量,本文利用相似标签对作为模型训练过程中的监督信息对哈希学习过程中产生的误差进行约束,为了平衡训练数据中的相似对和不相似对,设计了保持相似性学习的加权成对交叉熵损失函数。在CIFAR-10和NUS-WIDE数据集上的实验结果显示本方法与其他经典哈希检索方法相比有效地提高了图像检索的平均精度均值。(2)在上一方法的研究基础上,针对汉明空间的r近邻搜索,为进一步提高哈希码在汉明半径小于2时的图像检索任务中的判别性,本文提出使用柯西作为先验函数,引入基于柯西分布的交叉熵损失函数,同时为了降低出现过拟合现象的风险对其添加正则项,从而有效地提高了此时哈希码的判别性。并且引入多索引哈希,利用其建立高效的索引结构,以提升图像检索性能。在CIFAR-10和NUS-WIDE数据集上的实验结果显示本方法与其他经典哈希检索方法相比有效地提高了在汉明半径小于2时图像检索的平均精度均值。
其他文献
近些年来,随着数据量的快速迭代和爆发式增长,人们对数据的智能化处理要求越来越高,原有的算法和技术框架已经远不能满足人们日益增长的需求,人们急需一种新的数据处理范式,在这样的背景下基于神经网络的人工智能技术应运而生。现如今,人工智能技术正在以各种方式影响着人类生活的方方面面。文本生成作为人工智领域最具挑战性的研究课题之一,在自然语言处理领域占重要的地位。文本生成虽然具有很长的研究历史,但是大多为开放
学位
随着在线会议以及远程课堂的蓬勃发展,在线教育逐渐出现在了人们的视野中。传统教育中所有工作都基于教师和学生线下互动,教师随时都可能需要对学生进行干预,这对教师的工作效率有一定的影响。而在线教育平台则可以满足师生们的这些需求,例如在线练习与考试可以帮助教师节省批改时间,减少信息传达失误,也可以让学生在老师不在身边时能进行自主学习。但目前在线练习系统中的个性化内容主要是基于学生行为或是题目本身进行推荐,
学位
近年来,随着生活水平的提高以及饮食习惯的改变,糖尿病发病率逐年增加,并已成为对人们身体健康产生广泛影响的的一种慢性疾病。糖尿病视网膜病变是糖尿病一种极为常见并严重的并发症,已成为我国成年人失明的主要原因之一。因此,及时的诊断和治疗可以有效地避免对人们视力的危害。当前,筛查糖尿病视网膜病变主要通过眼科医生人工检查患者的眼底图像,但是由于眼底图像复杂、人工检查时间较长、效率低下、使得很多患者不能得到及
学位
作为学生学习生活的重要场所,教室的空气质量指数(Air Quality Index,AQI)直接影响学生的身体健康与学习效率,教室AQI的监管与评价尤为重要。现有的室内空气质量智能监管系统存在检测指标较少、实时监控缺乏以及评价方法不完善等问题。因此,利用物联网(Internetof Things,IoT)和Java Web等技术,设计一种教室AQI监管与模糊评价系统,对教室AQI进行合理的监管与评
学位
在大数据时代,个性化自主学习的呼声日益高涨,微课教学应时而生。微课以微视频为载体,精简了教学时间,具有较强的教学针对性,具备可重复观看及便于资源共享等特点,成为当今教育的热点。立体几何是高中数学教学中非常重要的知识板块,可以培养数学直观、逻辑推理、数学运算等学科素养。微课辅助立体几何教学,创新了教学形式,贯彻了学生为主体地位的教育理念,有着巨大的实际意义。基于此背景,笔者对立体几何的微课教学应用进
学位
近年来,教育大数据背景下教育领域信息化、网络化的推进,使得教育数据资源快速积累,随着教育信息化建设进入到应用的阶段,更多人工智能技术的兴起,激发了教育数据资源应用的深度挖掘与探索,也给需要借助传统统计学处理资源的众多学科新的解决思路,同时也将研究人员从处理与甄别工作中解放出来,专注于问题的研究与分析。目前教育信息化评估领域数据资源的采集处理与应用在不断地丰富完善,更多的算法应用到中小学评估资源的处
学位
近年来,随着互联网的快速发展,人们已经进入了大数据时代,各种信息数据都在实现着爆炸式的指数型增长,数据信息量处于过载状态。个性化推荐系统作为解决信息过载问题的有效手段,现已经广泛地应用到如电商平台,电影推荐,音乐推荐等各个领域当中,对于推荐算法的不断优化和改进,不仅能够提高用户体验,还能带来一定的商业价值,推动其他行业的发展。在推荐系统中推荐算法是最为关键的部分,良好的推荐算法能快速且较为准确的预
学位
大脑是生物体的“领导中心”,支配着身体的各项活动。大脑接收并处理复杂信息的原因是神经元网络之间的连通与协调的电活动。为了掌握大脑处理信息并发送指令的过程,需要高分辨率技术来监测神经元的电活动。测量神经元电活动的传统方法有:电压钳技术、电流钳技术和膜片钳技术,具体方法是用玻璃毛细管拉制成电极,穿透细胞膜获得神经元电生理特性,理解其动作电位的机制。大脑中的神经元有上千亿,用以上传统方法的缺点是同时监测
学位
互联网的快速发展在给人们带来便利的同时,也给人们的生活带来诸多安全隐患,其中信息安全尤为重要。为提高传输信息的安全性,保护个人隐私,很多学者在从事隐写技术研究,它是利用载体的冗余,将秘密信息嵌入到载体中通过公共信道进行传输,避免第三方的怀疑,从而实现秘密信息的传递。图像是隐写常用的载体之一,传统的以图像为载体的隐写术都是以单张图像作为载体,但单张图像作为载体隐写容量有限。为适应实际需求,确保秘密信
学位
抗生素耐药形势严峻,抗生素发展遇到了前所未有的挑战。了解抗生素耐药作用机制对于有效跟踪耐药性传播、优化治疗方法以及进行新药物研发至关重要。大量关于抗生素耐药性研究成果存在于生物医学文献中,使用文本挖掘相关方法自动从文本中获取信息有效降低了知识获取成本并提高了工作效率。本文将抗生素耐药性信息抽取建模为生物医学事件抽取任务,以期从生物医学文本中自动获取抗生素耐药作用机制信息。生物医学事件抽取主要由生物
学位