论文部分内容阅读
本文主要研究对样本数据进行特征提取的方法。 随着机器智能的发展,模式识别与机器学习技术在社会生产生活的很多领域中应用的越来越多,如图像识别、视频检索和文本处理等。而一个模式识别系统的设计和其分类性能的优劣,很大程度上都要受到特征提取的影响,特征提取是模式识别的关键技术。 本文对局部保持投影(Locality Preserving Projection,LPP)和核嵌入LPP特征提取方法进行了研究。LPP算法是让原始样本点经过一个线性变换投影到一个低维空间中去,用投影后的点代替原始样本点,该线性变换满足的要求是投影后的样本点仍然保持原来的近邻结构。如果原始样本点不能够进行线性分类,这种情况下通常引入核嵌入LPP算法,该算法首先让样本点经过一个非线性映射投影到一个较高维的空间中去,在该空间中使得样本点可以进行线性分类,接下来再使用传统的LPP算法来进行降维。可以发现目前常用的一些特征提取方法不能针对不同的流形进行相应的特征提取,以至于最后分类器的识别效果不够好。 对于上述问题,本文在核函数构造的方法上进行了探索,给出了一种基于核LPP的多核函数构造方法,改进了高维样本数据提取特征的方法。在数值试验过程中我们根据这种特征提取方法也提出了新的图像分类方法,通过在标准人脸库的分类实验也验证了本文提出的特征提取方法在高维数据样本上分类的有效性。