基于SimHash的相似人脸检索算法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:mingN78
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,基于内容的图像信息检索技术正逐渐成为研究的热点,而与此同时,作为非接触式的、友好的身份认证技术,人脸识别、检索方面相关的应用需求也越来越多。本文以人脸作为目标对象对大规模数据集下的快速检索方法进行了研究,主要的工作包括以下几个方面:在人脸检测和特征提取方面,重点讨论了本文采用的基于AdaBoost算法的快速人脸检测方法和基于经典PCA主成分分析算法的人脸识别方法。AdaBoost算法运算速度快,检测率高,对人脸的姿态变化和遮挡等因素具有很强的鲁棒性,尤为适合实时系统中应用;PCA算法将标准人脸投影到主成分构成的特征空间中,着重区分不同人的人脸之间的差异性,在本文中实现第一次降维。在人脸检索方面,针对传统的人脸检索技术在面对高维向量时,通常会面临“维度灾难”而导致检索速度慢的问题,引入SimHash算法,尝试对人脸图像使用PCA和SimHash两次降维的方法。首先使用PCA提取人脸图像的特征向量,去除冗余信息并进行第一次降维,得到主成份特征向量,然后使用SimHash算法再次降维使特征重分布,并将哈希结果尽量均匀的散开到232个象限中,从而得到最终的32位比特序列作为人脸签名。本文最后在Windows平台下采用Virtual Studio2008及MFC框架,使用Opencv开源计算机视觉库,对该算法做了简单的系统实现和验证。本文最后使用ORL人脸库在Matlab下对该算法的性能做了大致的评估。可以看到,由于哈希冲突的影响,算法对人脸的检索正确率比直接使用PCA进行检索的情况略有下降,而在系统的平均检索时间上有所提高。
其他文献
自然场景中的文字通常蕴含了大量有价值的信息,为理解和分析场景提供了重要线索。而且对于很多视觉应用来说,自然场景中的文字检测算法是其中的关键性技术。因而几十年来,该
当今社会计算机应用领域的不断扩大、互联网的共享和开放,使得计算机信息网络快速发展,在人们的工作和生活中,计算机网络已经成为了信息交流的基本工具。随着社会上商业和贸易的兴起,以及金融、财政、网上购物等其他经济网络行为的产生,“数字经济”导致世界进入了一个新的发展阶段,而随之而来的计算机网络安全也变得备受重视。高科技的经济和商业犯罪的案件越来越频繁,黑客和反黑客、破坏和对抗的斗争越来越剧烈。网络安全作
随着网络中内容分发需求的日益增长,传统TCP/IP网络在以内容分发为主的网络环境中的弊端日益突显,因此信息中心网络(Information-Centric Networking,ICN)得以提出和发展。IC
随着WIMAX的迅猛发展,3GPP提出了长期演进(LTE)项目。与传统的通信业务比较,LTE在提高数据传输率、增大系统容量、提高频谱利用率、增强抗干扰、降低商用成本等多方面,都有着
智能视觉监控是计算机视觉领域新兴的研究方向,该方向融合了计算机应用、模式识别、图像处理、人工智能、数学等多门学科的关键技术,现已广泛应用于机器人导航、医学图像分析、
目前,网络视频监控系统得到了广泛运用,并在智能化、综合化的实现上取得了很大进展。随着国内3G和其它无线网络的不断建设和发展,移动视频监控已成为当前网络视频监控的一大
数字图像修复一直是一个很重要的基础性研究课题,从数学理论上讲,它属于病态问题。目前,有些图像修复算法取得了较好的修复效果,但耗时较为严重。本文主要研究结构图像快速修
通信信号调制方式的自动识别(简称调制识别)在军用和民用通信方面都是一个重要的课题。在军事上,它可以用于电子侦察,电子战和威胁分析等情形。战争状态下,分析截获信号的调制方式
为了使LTE系统能够向4G平滑演进,3GPP组织在2008年6月发布了LTE-Advanced系统的技术需求报告,明确了LTE-Advanced系统的最低需求:下行峰值速率为1Gbps,上行峰值速率为500Mbps,而上