论文部分内容阅读
主成分分析及其核推广在很多领域都有其广泛的应用,然而当数据中指标或样本数量十分巨大时,协方差矩阵或核矩阵的阶数将会很高,导致直接对其进行特征值分解的计算量过大,计算效率较低.同时考虑到主成分分析往往只需较少的k个特征对的值,因此为了在保证分析结果可靠性的基础上尽可能降低算法的运算时间,本文对Davidson方法进行了分析,并在该算法的基础上结合了矩阵随机低秩分解方法构造了一种新的改进算法来得到原矩阵前k个最大特征值及其对应特征向量的近似解,以弥补Davidson方法在迭代过程中可能导致迭代矩阵阶数增长迅速导致算法效率下降的问题.理论分析和实际计算结果表明,在主成分分析中使用这种改进算法无论是在分析结果的可靠性还是程序的运行时间方面都有良好的表现,尤其是在面对高维数据进行主成分分析时具有很好的使用价值.