论文部分内容阅读
大部分的人脸识别方法利用大量正确标记的训练样本来学习精度足够高的识别模型。收集人脸图像并对其进行正确的标记会耗费大量的人力、物力,且现实情况中人脸图像因光照等变化的影响而要求学习器能够不断学习新的知识。为了实现这种需求,研究者提出了增量学习和半监督学习:前者利用增量数据去改善原始数据,混合后的数据保留了有用的部分而删除了大部分无用的数据,使学习器能不断进行训练;后者有效利用无标记的样本,使分类精度尽量接近标记已知时的结果。但当新增的数据集中含有噪声时,这两种方法各有弊端。文章所提方法适合于多次学习,利用少量标签正确的原始数据和含有类别噪声的增量数据进行学习。利用原始数据对增量集赋置信度,根据这个置信度删除被判定为噪声的样本,学习出多个分类器,并采取不同的策略对测试集进行投票决定其最终类别。本文主要取得了以下成果:(1)提出了基于SVM的多个学习器方法Multi_SVM,并将其用于人脸识别。Multi_SVM方法基于SVM训练出多个分类器,对被判定为噪声的数据采取丢弃策略,对未知的测试样本通过投票决定其最终类别。所有学习器对噪声的容忍都是有一定限度的,这个限度的高低是决定分类器性能的重要指标。实验表明,Multi_SVM方法对噪声有更强的抵抗能力。(2)提出了基于TSVM的的多个学习器方法Multi_TSVM。Multi_TSVM方法与Multi_SVM方法思想相同,均将判断为噪声的样本删除,提高整个数据集的质量后进行学习。不同之处是Multi_TSVM方法中多个分类器的训练采取的是TSVM方法。实验表明,Multi_TSVM能进一步提高Multi_SVM的性能。(3)对Multi_SVM、Multi_TSVM与TSVM进行比较。实验中我们得出:Multi_SVM方法、Multi_TSVM方法与TSVM方法性能均优于SVM,且Multi_TSVM方法优于Multi_SVM方法。