论文部分内容阅读
随着互联网及多媒体时代的迅猛发展,海量的图像信息充斥在人们生活的方方面面。近年来,如何从海量图像中快速、准确地获得其分类信息成为一种迫切需求。图像分类技术作为计算机视觉领域的热点问题,其研究意义极其重要。在实际应用领域中,视频监控系统的车型行人分类的应用非常广泛。由于实际应用对分类准确率和实时性要求较高,所以如何设计能实际应用的算法成为一个重要问题。其次,在已有大量标记图像样本域(源域)和新的少量样本域(目标域)的条件下,如何充分利用现有知识提高目标域上的分类准确率有很强的应用意义。因此本文针对这两个问题展开。针对第一个问题,本文采用基于词袋模型的车型行人分类方法。首先,考虑到光线和几何不变性,本文提取HOG特征作为图像特征描述。其次,为了避免高维特征造成的信息冗余和噪声,本文采用了主成分分析法对高维特征进行降维处理。最后在训练阶段,通过采集道路视频建立一个由30016张图像构成的由6种类别构成的有标记数据库,并训练出非线性的SVM分类模型,其中核函数采用的是RBF核函数,并通过K-fold交叉验证法优化模型参数。本文提出的基于词袋模型的车型行人分类算法在分类准确率及实时性上都能满足实际应用的要求。针对第二个问题,由于实际获取标记样本困难,而少量的标记样本无法训练出理想的分类器,本文提出一种基于迁移学习的图像分类算法。不同域的数据特征分布有差异,直接使用源域数据对目标域样本进行分类的效果并不理想。因此为了提高源域的类内紧凑性和类间区分性,本文首先提出一种改进的边际Fisher准则方法,采用内积度量的方式对源域进行了特征映射。其次,本文提出了一种去除源域中的边缘奇异点并与目标域中的标记样本点组成训练样本对的自适应算法,来保证在迁移学习阶段筛选出合理的训练样本对。并在核化空间上,本文学习了目标域到源域的特征转换,将目标域映射到源域。最后利用源域上训练好的knn分类器完成对映射后的目标域样本的分类。本文算法创新点主要有:(1)改进传统的边际Fisher准则,更充分地利用源域标记样本;(2)重点考虑迁移学习与训练样本对紧密相关,提出一种自适应训练样本对筛选算法,尽可能保证映射的可靠性。在通用数据集上的实验结果表明,本文的算法不仅提高了在小样本数据上的分类性能,而且随着目标域可用标记样本数的增加,本文算法的性能较其他算法提升得更明显。