论文部分内容阅读
近些年来,人脸检索技术已经融入到国家安全、金融、民政、监控等各个领域。一方面,随着互联网人脸图片的爆炸式增长,如何从海量人脸数据中快速检索出相关人脸已经成为当前亟需解决的难题,以哈希为代表的近似近邻搜索方法得到广泛关注和研究。另一方面,卷积神经网络在计算机视觉等领域取得了惊人的性能。于是,深度哈希算法受到了研究者的青睐。已有深度哈希算法往往存在着忽略二值化处理过程中带来的数据分布变化、无法充分利用网络特征提取能力促进哈希函数学习等问题,并且卷积神经网络需要昂贵的计算代价和巨大的参数存储空间。基于此,本文提出了基于分类和量化误差的深度哈希算法,并进一步地对深度网络进行压缩,在保证网络识别精度的同时,加快计算效率和减少参数存储空间。最终,本文设计并实现了一个互联网图片人脸检索系统。本文的具体工作如下:1)创新性地提出了基于深度哈希的人脸检索算法。本文利用深度神经网络能够有效学习图像特征的优势,将深度网络与哈希编码进行结合,通过分类误差和量化误差来直接指导网络的训练,最大程度地保持原始数据的聚类分布性并减少二值量化误差,从而求得同时满足检索准确性和实效性的哈希特征。本文将图像特征学习、哈希函数学习以及分类器学习统一到一个端到端网络结构中,从深度哈希函数、目标损失函数、以及针对性地层次特征融合三个方面对已有哈希算法进行改进,丰富的实验结果充分说明了方法的有效性。2)利用深度压缩算法压缩提出的人脸检索模型。随着网络模型在深度和宽度方面的不断扩展,模型的计算量和参数的存储空间呈几何倍增长。本文利用已有的深度压缩算法,从网络剪枝、权重量化和共享以及最终的霍夫曼编码三个方面实现对参数存储的空间压缩。在网络精度无损的基本前提下,成功地在LeNet-5网络、AlexNet网络、VGG-16网络以及本文提出的DHCQ网络上实现了参数压缩,最终取得了 35-49倍的网络压缩比率。3)设计并实现了互联网图片人脸检索系统。该系统可以让用户便捷地浏览人脸检索结果,并且会给出当前检索情况下具体的评价指标MAP,方便用户从客观指标和返回结果两方面评价人脸检索的最终效果。