子空间分析和最近邻分类算法及在人脸识别中的应用

来源 :北京大学 | 被引量 : 0次 | 上传用户:jiangguoliang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人脸识别是目前人工智能领域内一个重要的研究方向。在人脸识别问题中,训练样本的维度过高而样本数相对较少往往会导致维度灾难,从而影响识别效果。研究能够充分提取数据中判别信息的降维算法,并根据人脸数据的特点设计有效的分类器是一个具有重要研究价值的课题。 本文围绕一些经典的降维与分类算法,特别是子空间分析和最近邻分类展开分析和研究,给出了一种新的判别准则用于解决基于核的子空间分析中存在的一些问题,并提出了用于数据降维的分组变量方法及基于多个训练样本的回归最近邻分类等算法。 论文首先对人脸识别领域的一些经典方法和近期发展进行了总结,然后综合的比较和分析了目前广泛应用的降维和识别算法。特别的,我们着重对降维算法里面常用的各种子空间分析方法进行了讨论和数值实验。 基于核函数的各种算法是子空间分析中一个热点。针对基于核函数的子空间分析方法中存在的一些问题,如核函数的选取及算法中的奇异问题,本文进行了一些讨论和探索,得到了在核判别分析中出现过拟合的原因。为了解决该问题,我们首先利用多个核函数生成一个大的希尔伯特空间,在此基础上提出了一种新的判别分析准则;通过该准则我们将寻找最优核函数组合的过程与判别分析过程本身融合在一起。利用对解空间的限制,该方法不仅避免了求解过程中的奇异值问题而且也一定程度上解决了以往核方法所存在的过拟合问题。 结合子空间分析的技巧及人脸图像的一些特性,本文还提出了一种基于分类变量的数据降维算法。该方法先利用训练样本将变量分成不同的类;接着在各类变量所组成的子数据集中进行进行降维以消除冗余信息并得到每类变量的新的低维表达;最后再将降维后的各组数据综合起来,得到最终新的数据。从理论上讲,变量分类方法是一种具有稀疏性质的特征选取算法;另一方面,我们还在各个人脸库上对该方法和其他常用算法进行了比较,所得的实验结果表现出该算法具有一定的优越性。 此外,本文还对人脸识别中最常用的最近邻分类算法进行了研究。我们提出一种回归最近邻方法,通过回归模型将每类测试样本到给定类别的距离转化成回归残差,并把该距离信息整合到最近邻分类器中。采用这种回归最近邻的算法框架,我们将该方法扩展到非线性空间中,提出了核回归最近邻方法。该方法不仅极大地促进了最近邻分类的效率,同时也在人脸库上的对比试验取得了较好的结果。
其他文献
本文通过对荣华二采区10
期刊
随着移动互联网的迅速发展,各类无线应用已经成了人们日常生活的重要组成部分,人们对无线业务的时效性、便捷性的要求,也随着通信技术的发展而变得越来越高。然而,目前大部分
随着信息的数字化和网络技术的发展,数字图书馆中拥有的数字内容越来越多,多个数字图书馆之间的资源/服务也存在关联关系。在分布式环境中实现这些数字资源之间的OpenURL参考连
发射波束形成可以使发射方向图在干扰方向形成零陷,即在有干扰的方向不发射功率,使敌方侦察系统不能发现我方设备的存在,从而可大大地提高我方设备的生存能力。而唯相位自适应波
网格技术整合在地理上广泛分布的异构计算资源和解决技术协作问题,在近年来得到越来越迅猛的发展,网格系统的核心是网格中间件。网格中间件是由各个节点上的容器及部署在容器中
联机分析处理(On-LineAnalyticalProcessing,简称OLAP)技术作为基于数据仓库(DataWarehouse,简称DW)的一种应用,利用多维数据模型,对企业已有的各种数据进行分析,发掘业务变动与趋
本文着重对桑黄(Phellinus igniariu)菌丝发酵工艺进行了初步的检测,并对其产物中的桑黄多糖进行了分离、纯化,在此基础上对桑黄多糖进行结构分析,推测出桑黄多糖的可能结构
在当前的移动通信中,人们对数据通信的容量需求越来越大。协作多点传输技术,又称为基站协作技术,已经成为了对抗小区间干扰、提高网络吞吐量和用户公平性的一项关键技术。本
三年前,课题自主研发的分布式宽带监控数据单元W—DMDU成功应用于全国首条信息化高速公路——通启高速,该系统作为监控系统核心设备,实现了全数字化的全程监控,但是随着监控图像
脑是一个由上千亿个神经元组成的极为复杂而有序的巨系统,在皮层下结构与大脑皮层之间、皮层的各部分之间均存在着交互联系,形成多层次的特异性通路和非特异性网络。在探索大脑