论文部分内容阅读
数据降维是模式识别、机器学习、数据挖掘等领域的一个关键科学问题。它利用线性或非线性变换将高维空间的数据映射到低维空间,从而便于后续分析。随着数据采集技术、通信技术和计算机技术的飞速发展,数据的规模越来越大、维度也越来越高,这使得原有数据降维技术的运算复杂度大大增加,甚至无法进行。对此,从流形学习入手,深入研究基于流形学习的增量无监督降维方法。论文的主要内容有:(1)针对批处理方式的近邻保持嵌入(Neighborhood Preserving Embedding,NPE)算法对于新增样本计算复杂度高的问题,研究了增量近邻保持嵌入(Incremental Neighborhood Preserving Embedding,INPE)算法。该增量学习算法在新样本不断加入时,充分利用已有数据的部分处理结果,避免了由于新样本加入导致的重复运算问题,大大降低了计算复杂度,提高了处理速度。在AR、ORL、FERET人脸数据库上的实验结果验证了该算法的有效性和可行性。(2)二维局部保持投影(Two-dimensional Locality Preserving Projection,2DLPP)算法在处理大规模高维数据时,具有很高的时间和空间复杂度。对此,研究了基于模型合并的增量二维局部保持投影(Merging-based Incremental Two-dimensional Locality Preserving Projection,M-I2DLPP)算法。M-I2DLPP算法通过建立与数据集相对应的2DLPP数据表示模型,然后合并不同的2DLPP子表示模型,最后得到所有数据的2DLPP总表示模型,并通过矩阵分解求解投影方向。在AR、ORL、FERET人脸数据库上的实验结果表明了该算法的有效性和可行性。