基于增量标号噪声数据学习的人脸识别研究

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:a415013145
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大部分的人脸识别方法利用大量正确标记的训练样本来学习精度足够高的识别模型。收集人脸图像并对其进行正确的标记会耗费大量的人力、物力,且现实情况中人脸图像因光照等变化的影响而要求学习器能够不断学习新的知识。为了实现这种需求,研究者提出了增量学习和半监督学习:前者利用增量数据去改善原始数据,混合后的数据保留了有用的部分而删除了大部分无用的数据,使学习器能不断进行训练;后者有效利用无标记的样本,使分类精度尽量接近标记已知时的结果。但当新增的数据集中含有噪声时,这两种方法各有弊端。文章所提方法适合于多次学习,利用少量标签正确的原始数据和含有类别噪声的增量数据进行学习。利用原始数据对增量集赋置信度,根据这个置信度删除被判定为噪声的样本,学习出多个分类器,并采取不同的策略对测试集进行投票决定其最终类别。本文主要取得了以下成果:(1)提出了基于SVM的多个学习器方法Multi_SVM,并将其用于人脸识别。Multi_SVM方法基于SVM训练出多个分类器,对被判定为噪声的数据采取丢弃策略,对未知的测试样本通过投票决定其最终类别。所有学习器对噪声的容忍都是有一定限度的,这个限度的高低是决定分类器性能的重要指标。实验表明,Multi_SVM方法对噪声有更强的抵抗能力。(2)提出了基于TSVM的的多个学习器方法Multi_TSVM。Multi_TSVM方法与Multi_SVM方法思想相同,均将判断为噪声的样本删除,提高整个数据集的质量后进行学习。不同之处是Multi_TSVM方法中多个分类器的训练采取的是TSVM方法。实验表明,Multi_TSVM能进一步提高Multi_SVM的性能。(3)对Multi_SVM、Multi_TSVM与TSVM进行比较。实验中我们得出:Multi_SVM方法、Multi_TSVM方法与TSVM方法性能均优于SVM,且Multi_TSVM方法优于Multi_SVM方法。
其他文献
随着网络信息技术的快速发展,可收集信息的种类和数量都呈指数增长,而基于信息共享、科学研究等方面的需要,数据收集者需将收集到的数据信息进行发布。由于发布的信息中涉及到很
随着服务组合系统的广泛应用,许多新的研究问题被提出。由于Web服务松散、低耦合等特点,使得Web服务之间的异步交互方式被广泛的采用。而以往的研究往往局限于同步交互情形,很少
计算机动画技术的飞速发展使得人体动画在虚拟现实、影视娱乐、视频游戏、教育培训、体育和军事仿真等领域得到了广泛应用。运动捕获技术的出现及大规模商业化应用,为人体动
二维网状(mesh)的处理器阵列具有规整的结构,能够对图形图像数据进行高效处理。近年来,超大规模集成电路(VLSI)和晶片规模集成电路(WSI)的集成技术和工艺发展的越来越成熟,VLSI
随着科学技术的飞速发展,越来越多的传感器应用于各个领域中。图像融合就是利用各种成像传感器不同的成像方式,提供互补信息,增加图像的信息量,提高对环境的适应性,以获得更
随着互联网的普及,电子邮件已经成为人们生活中通信、交流的工具之一,但是随着电子邮件的广泛普及和电子邮件发送的低成本,人们面临的一个严峻的问题就是:任何人的电子邮件地址只
月球是地球的近邻,探测月球能帮助人类认识宇宙的起源演化。利用月球探测数据对大地测量参数的准确估计对得出精确的月球模型,更好的研究月球表面的资源有重要意义。本课题是
数字图像技术作为数字技术中的重要领域,近年来得到飞速发展,已经在现实生活诸多方面得到广泛应用。影像是人类从外界获取信息的重要手段之一,同时也以其特殊的形式记录了很
聚类分析作为数据挖掘的一个重要研究方向,可以有效地挖掘出这些数据背后所包含的知识,在金融、电信、保险业、市场营销、网络异常检测、网络安全、科学决策等方面具有十分重要
软硬件协同设计已经成为嵌入式系统开发的主流技术,推动着嵌入式系统向着更高集成度和更高计算能力的方向发展。评价MPSoC性能的指标有很多,如执行时间、硬件面积、功耗等,而诸