论文部分内容阅读
本文主要研究了四类相关结构下,纵向数据的参数推断问题.具体包括:(1)相关矩阵可以表示为一些已知矩阵的线性组合;(2)相关矩阵的逆矩阵可以表示为一些已知矩阵的线性组合;(3)相关矩阵为分块对角矩阵,且对角线上的子矩阵可以表示为一些已知矩阵的线性组合;(4)相关矩阵为分块对角矩阵,且对角线上子矩阵的逆矩阵可以表示为一些已知矩阵的线性组合.许多科学研究经常需要从实验中收集数据,这些实验中的变量在一段时间内被重复记录,学者们用这些数据来研究感兴趣的变量(反应变量)如何依赖于观测对象的某些特质(协变量),这样的数据被称为纵向数据.纵向数据的特点是同一观测对象在不同的测量时间点得到的测量数据是相互关联的,但不同观测对象的测量结果又是相互独立的,即纵向数据同时具有组内相关性和组间独立性两个特点.如何正确识别数据的组内相关性一直是纵向数据分析的难点,也是这些年统计学的热点问题之一.因此,研究关于相关结构给定下的参数统计推断问题具有重要的理论意义和实践意义.纵向数据分析中最常用的模型是广义线性模型.而广义线性模型的最根本问题是如何利用数据的组间相关性来提高参数统计推断的效率和准确度.目前应用最广泛的方法是Liang and Zeger提出的广义估计方程(GEE)方法.尽管当工具相关矩阵被错误指定时,GEE方法仍能保证估计的相合性,但估计的效率会大大降低.为了避免这个问题,本文基于上述四种相关结构,提出了一种新的估计思想:两步估计法.简要的说,该方法每次迭代分为两个子步骤,在给定相关矩阵的条件下,求解拟似然方程得到回归参数的估计;基于参数的估计值,计算经验相关矩阵,在给定的相关结构中,寻找与经验相关矩阵距离最小的矩阵做为相关矩阵的估计.重复上述步骤直到算法收敛为止.该方法可以有效地处理纵向数据组内相关性,而且可以避免相关矩阵被错误识别.在第一种相关结构和第二种相关结构下,我们给出了各自的两步估计法,并证明了方法的渐近性质,文中的模拟计算和实例分析都说明了该方法的优越性和稳健性.接着讨论了纵向数据中同一观测对象的观测数据按实际情况被分成若干部分,各部分之间相互独立的情形,即相关结构是分块对角矩阵,对角线上的子矩阵可以表示为已知矩阵的线性组合或者子矩阵的逆矩阵可表示为已知矩阵的线性组合时的两步估计法.最后,我们讨论了上述四种相关结构下,两步估计法对缺失数据的处理。