论文部分内容阅读
随着科技的迅猛发展,数据已成为社会生产生活不可或缺的非常重要的组成部分。当今世界已步入大数据时代。声音、图像、文本等类型的数据往往高达几十乃至上千万维,这使得数据分析难度随维数的增长而呈指数增长,引发“维数灾难”。因此,在进行海量、高维数据分析时,需要对原始数据做降维处理。降维处理算法大致分为线性降维和非线性降维算法两类。复杂多变的高维数据具有非线性分布特性,而非简单的线性分布,因此线性降维处理方法难以满足高维、海量非线性数据的处理要求,迫切需要非线性特征分析方法来解决此类问题。鉴于此,本文分别针对近红外光谱的玉米籽粒单倍体鉴别和手指静脉识别两个典型应用,开展非线性特征分析方法及应用关键技术研究。主要研究成果如下: (1)针对玉米籽粒单倍体鉴别问题,提出一种基于核主成分分析(Kernel Principal Components Analysis,KPCA)的近红外光谱特征分析方法,并针对核函数的选择问题以及核函数的参数设置问题进行研究分析。实验结果表明,该方法可以大幅提高基于近红外光谱的玉米单倍体的分类准确率并达到94%,而且模型的稳定性较好。 (2)针对近红外光谱的玉米籽粒单倍体鉴别问题,进一步研究基于流形学习的非线性特征分析及其应用关键技术,提出一种基于信息论和稠密空间的有监督虚拟样本核局部保持投影(Supervised Virtual Sample Kernel Locality Preserving Projection,SVSKLPP)算法,并针对邻域选择、降维维数等问题进行研究分析。实验结果表明,新方法可以有效地利用样本的类别信息和邻域信息保持样本的本质结构,提高模型的准确识别率达到97%并改善了模型的稳定性。 (3)针对手指静脉识别问题,研究基于神经网络的非线性特征分析及其应用关键技术。首先针对公开数据库不足的问题,提出手指静脉数据采集方案,并建立手指静脉数据库;针对手指静脉图像中的大量噪声,提出一种基于全局和局部信息相结合的图像预处理方法,能有效去除噪声;在此基础上,提出采用深度学习模型的手指静脉识别方法,建立了一种深度学习网络结构,研究其网络参数设置;提出了改进的pooling层——maxmin-pooling,新方法可以有效增强手指特征图像的对比度,增强了网络鲁棒性。实验结果表明本文所提算法具有更高的处理效率,可训练出识别率更高、更为鲁棒的网络模型。