基于深度学习的互联网图片人脸检索系统

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:asjdkajsk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年来,人脸检索技术已经融入到国家安全、金融、民政、监控等各个领域。一方面,随着互联网人脸图片的爆炸式增长,如何从海量人脸数据中快速检索出相关人脸已经成为当前亟需解决的难题,以哈希为代表的近似近邻搜索方法得到广泛关注和研究。另一方面,卷积神经网络在计算机视觉等领域取得了惊人的性能。于是,深度哈希算法受到了研究者的青睐。已有深度哈希算法往往存在着忽略二值化处理过程中带来的数据分布变化、无法充分利用网络特征提取能力促进哈希函数学习等问题,并且卷积神经网络需要昂贵的计算代价和巨大的参数存储空间。基于此,本文提出了基于分类和量化误差的深度哈希算法,并进一步地对深度网络进行压缩,在保证网络识别精度的同时,加快计算效率和减少参数存储空间。最终,本文设计并实现了一个互联网图片人脸检索系统。本文的具体工作如下:1)创新性地提出了基于深度哈希的人脸检索算法。本文利用深度神经网络能够有效学习图像特征的优势,将深度网络与哈希编码进行结合,通过分类误差和量化误差来直接指导网络的训练,最大程度地保持原始数据的聚类分布性并减少二值量化误差,从而求得同时满足检索准确性和实效性的哈希特征。本文将图像特征学习、哈希函数学习以及分类器学习统一到一个端到端网络结构中,从深度哈希函数、目标损失函数、以及针对性地层次特征融合三个方面对已有哈希算法进行改进,丰富的实验结果充分说明了方法的有效性。2)利用深度压缩算法压缩提出的人脸检索模型。随着网络模型在深度和宽度方面的不断扩展,模型的计算量和参数的存储空间呈几何倍增长。本文利用已有的深度压缩算法,从网络剪枝、权重量化和共享以及最终的霍夫曼编码三个方面实现对参数存储的空间压缩。在网络精度无损的基本前提下,成功地在LeNet-5网络、AlexNet网络、VGG-16网络以及本文提出的DHCQ网络上实现了参数压缩,最终取得了 35-49倍的网络压缩比率。3)设计并实现了互联网图片人脸检索系统。该系统可以让用户便捷地浏览人脸检索结果,并且会给出当前检索情况下具体的评价指标MAP,方便用户从客观指标和返回结果两方面评价人脸检索的最终效果。
其他文献
语文信息化教学是近年来出现的教学新形势。随着教育理念和教学方式的变革,我们可以把语文信息化教学设计理解为:"应用现代信息技术,对语文学习资源和语文学习过程进行设计、
目的对基本药物招标中"安徽模式"的运行机制及特点进行深入剖析,为"安徽模式"的改进及推广提供建议。方法通过横向比较、纵向分析以及参照对比等方法,对"安徽模式"进行实证分
高速公路大修工程采用罩面方案时,新铺面层与旧路面面层间的黏结状况是影响罩面路段路面综合使用性能的重要因素。基于维他橡胶沥青优异的黏结力和弹性变形能力,依托京沪高速
现代通识教育必须重视道德教育□李萍通识教育,是指为使人的素质获得全面发展,适应现代科学技术和社会生活需要而进行的综合性、普适性的教育。随着中国社会主义现代化根本目标
<正>药品是防病治病的物质基础,其质量的优劣直接关系到全校师生的生命安全。医院药剂科必须根据《药品管理法》的规定加强药品管理规范化。国务院早在九四年九月就发出了关
<正>说起印染行业,可能很多人都会皱着眉摇头。原因无他,印染业给人的印象是个高能源消耗、高污染排放的行业。就是这样一个"不讨人喜"的印染业却是浙江省的重要产业之一。为
随着影视作品的不断创新发展,越来越多的钢琴音乐也被引用其中。根据钢琴音乐的特点,它可以增强影视作品中的视听效果,能够帮助升华影视作品的主题,在一些特定的场景中还可以
配股是上市公司再融资的重要方式之一,对我国上市公司的经营业绩有重要的影响。本文以1999~ 2003年进行过配股的564家上市公司为样本,对配股融资对上市公司的经营业绩的影响进
本文采用两种业绩对照基准和两种经典的回报率计算方法,系统的考察了公司配股后的长期回报率业绩,同时也考察了公司配股的长期会计业绩。研究发现:采用行业和规模对照组作为
"同课异构"教学设计和片段教学竞赛,体现了教师的教育教学理念和实际教学能力。其竞赛水平固然与教师平时的教学基本功密切相关,但关键还在于赛场中如何彰显出自己的教学理念