论文部分内容阅读
在主成分分析的基础上,基于协方差平稳过程理论和线性算子谱分析理论,本文提出了谱主成分分析。首先建立了协方差平稳过程的协方差函数与积分方程中对称正定Mercer核函数的等价关系,即协方差平稳过程的协方差函数是对称正定Mercer核函数,反过来,对给定的对称正定核函数,证明了存在协方差平稳过程,使得此协方差平稳过程对应的协方差函数恰好为给定的对称正定核函数,这说明协方差函数和对称正定核函数是等价的。建立了谱主成分算法与主成分分析及核主成分分析的关系。 由协方差平稳过程,得到谱主成分分析算法也有类似于主成分分析算法的稳定性和收敛性。对给定的样本点,由样本点为变量的协方差函数构成的矩阵,当样本点个数趋于无穷大时,证明此矩阵谱逼近于积分方程正定核的谱逼近定理。谱主成分分析类同于主成分分析能过滤数据的噪声。由协方差函数的统计特征,可给出核函数的参数估计。 如果协方差平稳随机过程的状态是一维的,对给定的样本点,给出了协方差函数的估计和其对应谱(密度)函数估计,而不必选择核函数及其参数。 通过数值例子计算表明:取不同核函数而得到的谱主成分分析,其谱主成分的个数及累积方差贡献率是有差别的。当选取合适的核函数和参数时,谱主成分的个数比主成分的个数要小且累积方差贡献率要大。当变量X的维数n很大时,谱主成分分析比主成分分析明显有效。 将谱主成分分析应用于多指标评价系统中,通过数值例子分析:主成分分析是通过对各个主成分加权构造评价函数,当主成分个数不小三个时,从第二个特征向量开始,对方向的不同选取,可导致评价函数的极大差异:而用谱主成分分析,能做到只取一个谱主成分就可使方差贡献率大于90%。在作多指标评价中,选用多项式核函数而得到的谱主成分分析,比主成分分析得到的主成分具有维数低且精度高的优点;而用Gauss核函数和Laplace核函数的谱主成分分析,需对原数据作同类别数据间的规范化,其构造的评价函数也优于用主成分方法构造的评价函数。但当主成分分析的第一主成分的方差贡献率不小于85%时,用谱主成分分析和主成分分析所得的评价函数曲线相似。 在MATLAB环境下,谱主成分分析的程序通常在十几条语句左右,数据分析和图表分析结果容易得到。