论文部分内容阅读
计算科学的飞速发展使高维度海量数据的处理分析成为可能,高维数据的理论与应用研究正方兴未艾。高维随机矩阵谱行为的研究为高维数据处理分析提供了统计理论的支持,使得高维数据的处理分析更加规范、精确。“随机矩阵”就是在某些概率空间中,以随机变量作为矩阵元素的一类矩阵。随机矩阵谱分析则是以随机矩阵的特征值和特征向量为研究对象,探索其理论性质和分布规律的理论研究。从高维随机矩阵谱的行为入手,主要研究内容如下:
首先,采用Stieltjes变换的方法,研究高维向量自回归滑动平均模型(VARMA模型)自互样本协方差矩阵的极限谱分布。该极限谱分布在大多数情况下并没有显式表达式,因此本文采用一种基于核估计的非参数方法,给出极限谱分布函数和谱密度函数的估计,证明它的一致性并给出收敛速度。由于在其极限谱密度函数中含有自回归系数的信息,本文采用“均值-中位数”方法来估计这些系数,并且证明其一致性和稳健性。
其次,采用大偏差定理和Green替换的方法,针对高维VARMA这种在时间上相依的模型,证明其自互样本极值特征根的极限分布为“Tracy-Widom(TW)分布”,并且在普适性的基础下研究非高斯总体情形下的相应结果。具体地说,在满足怎样的矩条件时,其极值特征根的极限分布亦是所谓的“TW分布”。另外,在统计应用部分,采用对比试验的方法,探究其与传统迹检验方法的优劣,试验内容涉及定阶检验,参数检验等等。
最后,基于离群特征值对极限定理产生的影响,将线性谱统计量的中心极限定理扩展到高维离群模型当中,记之为Hp CLT,消除其直接采用传统线性谱统计量中心极限定理时经验均值,方差参数和渐近均值,方差参数之间的系统偏差。并采用对比试验的方法,展示这种偏差的消除效果。
首先,采用Stieltjes变换的方法,研究高维向量自回归滑动平均模型(VARMA模型)自互样本协方差矩阵的极限谱分布。该极限谱分布在大多数情况下并没有显式表达式,因此本文采用一种基于核估计的非参数方法,给出极限谱分布函数和谱密度函数的估计,证明它的一致性并给出收敛速度。由于在其极限谱密度函数中含有自回归系数的信息,本文采用“均值-中位数”方法来估计这些系数,并且证明其一致性和稳健性。
其次,采用大偏差定理和Green替换的方法,针对高维VARMA这种在时间上相依的模型,证明其自互样本极值特征根的极限分布为“Tracy-Widom(TW)分布”,并且在普适性的基础下研究非高斯总体情形下的相应结果。具体地说,在满足怎样的矩条件时,其极值特征根的极限分布亦是所谓的“TW分布”。另外,在统计应用部分,采用对比试验的方法,探究其与传统迹检验方法的优劣,试验内容涉及定阶检验,参数检验等等。
最后,基于离群特征值对极限定理产生的影响,将线性谱统计量的中心极限定理扩展到高维离群模型当中,记之为Hp CLT,消除其直接采用传统线性谱统计量中心极限定理时经验均值,方差参数和渐近均值,方差参数之间的系统偏差。并采用对比试验的方法,展示这种偏差的消除效果。