论文部分内容阅读
近年来,基于内容的图像信息检索技术正逐渐成为研究的热点,而与此同时,作为非接触式的、友好的身份认证技术,人脸识别、检索方面相关的应用需求也越来越多。本文以人脸作为目标对象对大规模数据集下的快速检索方法进行了研究,主要的工作包括以下几个方面:在人脸检测和特征提取方面,重点讨论了本文采用的基于AdaBoost算法的快速人脸检测方法和基于经典PCA主成分分析算法的人脸识别方法。AdaBoost算法运算速度快,检测率高,对人脸的姿态变化和遮挡等因素具有很强的鲁棒性,尤为适合实时系统中应用;PCA算法将标准人脸投影到主成分构成的特征空间中,着重区分不同人的人脸之间的差异性,在本文中实现第一次降维。在人脸检索方面,针对传统的人脸检索技术在面对高维向量时,通常会面临“维度灾难”而导致检索速度慢的问题,引入SimHash算法,尝试对人脸图像使用PCA和SimHash两次降维的方法。首先使用PCA提取人脸图像的特征向量,去除冗余信息并进行第一次降维,得到主成份特征向量,然后使用SimHash算法再次降维使特征重分布,并将哈希结果尽量均匀的散开到232个象限中,从而得到最终的32位比特序列作为人脸签名。本文最后在Windows平台下采用Virtual Studio2008及MFC框架,使用Opencv开源计算机视觉库,对该算法做了简单的系统实现和验证。本文最后使用ORL人脸库在Matlab下对该算法的性能做了大致的评估。可以看到,由于哈希冲突的影响,算法对人脸的检索正确率比直接使用PCA进行检索的情况略有下降,而在系统的平均检索时间上有所提高。