论文部分内容阅读
随着社会信息化程度的提高,网络上的数据规模每时每刻都在持续增加,人们讨论的热点问题也在不断变化。为了有效地处理和认知这些新增数据,利用其中隐含的有价值信息,人们越来越需要一种功能更为完善的分类方法。在有监督学习领域,传统基于概率统计学的多分类模型大多仅局限于一个预先规定数据集,若要使训练好的模型能够识别一个新的类则需要将模型的全部参数重新训练,这对于算法的实际应用来说是不合理的。因此一个可以随时添加新类别的多分类模型是人们所需要的,在有监督学习的前提下它能够根据新样本的特点做出一定改变从而可以对新样本中蕴涵的信息进行学习完成分类,此外这种改变的代价应低于重新训练整个模型。这种学习模式与人类自学习的过程也较为类似,所以具备很高的研究意义和前途。本篇论文在图像分类领域提出一种多分类优化方法,它在保证一定的分类识别精度的前提下,还能够实现上述功能。本文使用约束状态拍摄的虹膜图像作为多分类实验数据,利用分而治之的理念将一个复杂多分类问题转换为多个简单二分类问题,从而提升模型的灵活性,为了保证图像分类模型的整体性能结合了人工神经网络强大的特征提取能力。具体来说,本篇文章将一种Hadamard纠错输出编码方法作为“多对多”问题分解的框架,使用自设计的卷积神经网络训练基础分类器来保证每一个虹膜二分类的性能,通过联合两者来解决多分类问题,文中将该模型称之为Hadamard_ECOC&CNN。使用Hadamard纠错输出编码可以构造出适用于任意类别数量的分解框架,并且它在样本不足、特征不完整或算法本身存在缺陷的情况下也具有很好的校正效果。而卷积神经网络具有的局部感知、共享参数等特性使模型更适用于图像的分类识别并且无需手动选取特征,对于虹膜图像来说还可以保证一定程度上的位移和形状的不变性。更重要的是,通过将两者结合利用纠错输出码不需要所有码字完全对应就可以进行类别划分这一特点使模型可以在只重新训练部分参数的情况下添加新的类别,此外,文章通过比对测试样本编码与标准编码的差异,可以根据出错位直接追踪到错误分类的基分类器,通过微调技术进行纠正训练优化它们的参数从而使模型的整体精度可以得到进一步提升。本文采用中国科学院自动化研究所公开的CASIA-IRIS-LAMP-V4数据集的和吉林大学生物识别与信息安全技术实验室采集的JLU-4.0虹膜数据集进行实验,将测试集识别精度作为性能评判指标。实验结果表明:模型分别在两个数据集上取得了98.19%和96.35%的准确率,分类性能上超过了一些传统多分类方法。此外通过对纠正训练以及添加新类这两种新功能进行实验分析得到结论,表明纠正训练可以有限制的使模型的整体精度得到一定的提升,并且通过设定一个合理的阈值就可以在只重新训练部分基分类器的情况下实现添加新类的功能。