代价敏感降维及其人脸识别应用研究

来源 :南京师范大学 | 被引量 : 2次 | 上传用户:yangxzguoli
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的降维方法,追求最低的识别错误率,假设不同错分的损失相同。在一些实际应用中,这一假设可能是不成立的。例如,在基于人脸识别的门禁系统中,存在入侵者类和合法者类,将入侵者错分成合法者的损失往往要大于将合法者错分成入侵者的损失,而将合法者错分成入侵者的损失又要大于将合法者错分成其他合法者的损失。基于此,本文研究代价敏感的降维算法,主要工作如下:1.提出了一种代价敏感的加权局部保持投影(Weighted Cost-Sensitive Local Preserving Projection, WCSLPP)。传统的局部保持投影算法(Local Preserving Projection, LPP)追求最小的识别错误率,其投影方向受类别不平衡影响。为此,本文在LPP模型中嵌入错分代价,定义了一种满足最小错分损失准则的WCSLPP模型。另外,为了解决类别不平衡问题,WCSLPP采用加权策略,平衡了各类样本对投影方向的贡献。在人脸数据集上的实验结果表明了WCSLPP算法的有效性。2.提出了一种嵌入成对代价的线性判别分析(Pairwise Costs in Linear Discriminant Analysis, PCLDA)。PCLDA通过在线性判别分析(Linear Discriminant Analysis, LDA)中引入加权函数,其模型不仅近似于成对贝叶斯风险准则,而且有效抑制了离群类对投影方向的影响。此外,考虑到数据集中类分布密度的差异性,PCLDA定义了一种重要性函数,平衡了各类样本对投影方向的贡献。在人脸数据集上的实验结果表明了PCLDA算法的有效性。3.提出了一种嵌入成对代价的子类判别分析(Pairwise Costs in SubClass Discriminant Analysis, PCSCDA)。本文通过分析基于人脸识别的门禁系统,将其归为一个代价敏感的子类学习问题,然后将错分代价和聚类信息同时注入判别分析框架,提出了一种近似于成对贝叶斯风险准则的PCSCDA算法。在人脸数据集上的实验结果表明了PCSCDA算法的有效性。4.提出了一种嵌入成对代价的半监督判别分析(Pairwise Costs in Semi-Supervised Discriminant Analysis, PCSDA)。在实际的人脸识别应用中,存在大量无标记数据,要获取有标记数据难。为了有效利用无标签人脸图像的信息,PCSDA采用1:方法预测无标签人脸图像的标签信息,与现有标签扩展策略相比,不仅具有较高的预测精度,而且时间复杂度低;以此,再通过引入加权函数,给出了满足成对贝叶斯风险准则的目标函数,提高了投影方向的判别能力。在人脸数据集上的实验结果验证了PCSDA算法的有效性。5.提出了一种代价敏感的半监督Laplacian支持向量机(Sample-Dependent Cost-Sensitive Semi-Supervised Support Vector Machine, SCS-LapSVM)。实际应用问题可能是代价敏感的,而且数据集中可能存在类别不平衡、大量无标签样本以及噪声样本。针对该情况,SCS-LapSVM在采用无标签扩展策略的基础上,将考虑了数据不平衡的错分代价嵌入Laplacian支持向量机的经验损失和Laplacian正则化项中。进一步,考虑到噪声样本对决策平面的影响,SCS-LapSVM定义了一种样本依赖的代价,对噪声样本赋予较低的权重。在UCI数据集和NASA软件数据集上的实验结果表明了SCS-LapSVM算法的有效性。
其他文献
押注SUV,玛莎拉蒂何去何从?玛莎拉蒂的首款SUV,取名"Levante",在意大利语中意为来自地中海的"善变之风",这股从南方吹向北方的暖风,奇妙之处就在于,时而可以柔和拂面,转瞬又能迸发
“山寨”从诞生之日起,便饱受非议。无论是学术界还是社会大众都对“山寨”有着自己的理解。本文试图探讨山寨的成固,揭示山寨与知识产权保护之间的关系,从而阐明对待山寨现象山
伴随着航天遥感技术的迅猛发展,采集空间图像的需求也日益增长。为了解决有限的卫星通信信道容量和海量数据下传的矛盾,应用卫星数传系统在图像数据下传之前必须采用数据压缩
我国近几年的交通建设发展迅速,高速公路的建设速度上升显著.好的交通枢纽能够有效带动一个地区的经济发展,高质量的高速公路是万千人民生命安全的保障.在高速公路施工的过程
在学术英语学习中,阅读是满足学术研究的最重要技能。阅读能力强调了对语言的认知与理解力,更重视学习者在阅读过程中的行动、反思、协商、合作、调控的能力。只有从阅读内容