大规模人脸图像检索系统的研究与实现

来源 :电子科技大学 | 被引量 : 5次 | 上传用户:lhawk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的发展,现如今的我们已经处于一个信息爆炸的时代。如何高效的组织和利用这些信息,则成为当今时代的一个巨大挑战之一。对图像资源而言,其自身包含了丰富的、有用的信息,这些信息机器都无法直接处理。因此,大规模的图像检索成为一个极具研究意义和理论价值的课题。大规模的人脸图像检索作为其中的一个具体应用,同样是当下热门的研究方向。人脸图像检索,可分为两大部分,即人脸图像编码和高维索引设计。一个良好的人脸图像编码不仅要能辨别出不同人之间的区别,而且对同一个人的不同姿态、不同表情具有一定的容忍度。高维索引设计面临的难题则是“维数灾难”问题和检索效率问题。随着向量维度的增大和数据规模的增大,人脸图像检索系统的性能会急剧下降。本文以大规模的人脸图像检索为研究课题,旨在实现一个百万级别的大规模人脸图像检索系统。其主要内容如下:1.人脸图像编码。人脸图像与普通物体图像不同,它是一种非刚性的,具有特殊的性质。人脸部的五官特征明显,且位置相对固定。基于这些分析,本文在人脸对齐的基础之上选取五个关键基准点(左眼、右眼、鼻子、左嘴角、右嘴角),并以此提取相应的局部特征。对整个人脸图像,通过加噪自编码器(Denoise Autoencoder)自动生成全局特征。2.高维索引设计。法国自动化研究所的Jegon于2010年提出了非对称距离计算倒排索引机制(Inverted File with Asymmetric Distance Computation,IVFADC),非对称距离计算倒排索引机制很好的将积量化(Product Quantization,PQ)、非对称距离计算(Asymmetric Distance Computation,ADC)和倒排索引(inverted index)有机融合。实现了高效的大规模数据集上的高维检索。本文在IVFADC的基础之上,对全局特征和局部特征进行不同量化处理,并在建立倒排索引过程中,对每个输入向量匹配两条近邻的聚类中心,即增加一半的空间消耗,换取整个系统的查全率。
其他文献
多智能体系统的诞生和发展是分布式人工智能技术和网络技术发展的必然结果。多智能体系统的研究近几年来已经成为基于网络的分布式人工智能的研究热点。其研究的核心问题是一
软件工程是为解决软件危机而诞生的一门学科,基于构件的软件工程CBSE提高了软件生产效率和质量,日益成为软件开发的主流范型。构件具有黑盒性质,因此,构件通过接口提供服务,
汉字识别系统能将输入到计算机中的汉字图像,经过一系列处理后提取出汉字的基本特征,并同计算机标准汉字模板库中的模板进行比较进而识别出输入的汉字。汉字识别问题属于超多
在网络使用过程中,由于用户具有各自的兴趣爱好和访问习惯,因此其关注的内容不完全相同,使用网络的时间和服务也各不相同,并且不同的用户群体不可避免地带有各自的群体行为特征。
近年来,随着对实时数据库服务的需求越来越多,实时事务调度逐渐成为一个研究的热点。先前的研究大都集中在单个或多个类型的实时事务的调度与并发控制上,但是由于实时数据库的应
随着Internet信息的迅速增长,整个Web信息已经被各种各样可搜索的在线数据库所深化,这些信息隐藏在Web查询接口下面,传统的搜索引擎由于技术原因不能索引这些信息,称之为Deep Web
本文首先对符号执行当前的研究现状、技术挑战和解决方案进行了全面深入的研究,分析了目前主要的DSE软件,研究显示DSE技术经过近10年的研究进展显著,但是仍然面临一些技术难
随着互联网络的发展,对等网络技术作为一种新型的分布式网络模式得到越来越多的重视和研究。各种基于P2P技术的应用不断涌现,人们不再满足于只利用对等网络完成资源的搜索和
随着用户对多媒体内容的需求日益增大,传统的C/S结构流媒体服务已不能满足大量用户的同时在线,且易形成系统瓶颈、扩展性不高。IP组播技术也存在固有限制,难以广泛部署。CDN
图像配准是计算机视觉和模式识别领域中的一项重要课题,在遥感探测、医学成像和基于多传感器融合的目标识别等研究中都有重大的应用价值。气象图像配准是为了实现一幅图像与另