论文部分内容阅读
多元统计分析(Multivariate statistical analysis,MSA)是农学、医学、工程学、气象学、地质学、心理学等众多科学的问题的基本研究办法之一,在生产以及实际生活中有重要的应用价值。多元统计分析是一元统计分析的一个自然的推广。直观上很容易理解,对一个事物从多个方面进行观察要比只从一个角度观察更全面,分析判断会更准确。所以多元统计分析几乎伴随一元统计分析飞速发展起来。但是,随着计算机技术的飞速发展和人们搜集到的数据维数越来越大,特别是2000年以后,人们逐渐发现,经典的多元统计分析方法应用于大维数据分析时,会有较大且不能容忍的误差。应运而生,高维统计分析得到了飞速发展。方差齐次性,是统计分析中一个重要要求,特别是在线性回归和方差分析中。然而在多元分析中,方差齐性就变成解决协方差矩阵的齐性问题。如前所述,大维统计分析中协方差矩阵的齐性问题就变得更为重要了。本文的目的就是为协方差矩阵齐性检验问题建立一个新的,更优越的检验方法。本文主要讨论两总体协方差矩阵齐次性检验这个问题,将该问题推广到高维度情况下。第一章节,主要内容为一些储备知识,包括协方差矩阵检验的经典方法、高维方法,以及随机矩阵理论(Random Matrix Theory,RMT)是如何处理高维协方差矩阵检验的,相关基本概念也会在第一章节中给出。第二章节我们运用随机矩阵线性谱统计量(Linear Spectral Statistic,LSS)的中心极限定理(Central Limit Theorem,CLT)来完成高维协方差矩阵的检验问题,该方法基于对对数似然比检验(Logarithm Likelihood Ratio Test,Log—LRT)统计量进行修正,似然比统计量有一个较好的性质,在原假设成立的情况下,统计量是不变的,另外,我们还提出了一个形式相对简单的对数统计量,其表现和对数似然统计量的比较也在第二章中体现,不仅仅有我们提出的统计量的比较,还有跟Li和Chen[25]的结果、Cai等人[14]的结果进行了比较。最后,为了保证我们提出的统计量是不变统计量,我们给出了四阶矩估计的定理,证明了估计量是渐近无偏的,以及估计量的模拟表现。第三章内容是对皮莱(Pillai)统计量进行修正,Pillai统计量本质是一个迹统计量,迹统计量不仅简化了计算量,而且当维容比为1时,对数似然比统计量是没有定义的,此时迹统计量可以得到相应的结论。同时,在第三章我们给出了六个统计量的相互比较模拟结果:修正的对数似然比统计量、对数统计量、修正的Pillai迹统计量、迹统计量、Li和Chen[25]统计量、Cai等人[14]统计量。第四章节,我们展示了我们提出的统计量在实际数据标谱500股票数据上的应用。所有的证明部分我们放在了最后一个章节里。