论文部分内容阅读
变系数回归模型是纵向数据分析的重要工具。数据分析的主要目的是分析响应变景与时间和协变=阜=之间的关系。很明显,对模型做拟和优度检验是非常重要和有意义的。基于残差的检验统计量是经常使用的检验方法之一。由于模型中的系数函数是时间的非参数函数,本文作者必须使用非参数光滑方法对它进行估计,所以用已有的传统回归模型的检验方法功效可能不是很好。而且,大部分已有的检验统计量是刻度不变的,它的极限分布需要对方差进行估计。然而,对它的估计依赖具体的模型,一般来说,在备择假设下得到的方差估计比原假设下得到的要大。这可能会降低检验的功效。为了克服上述问题,在本文中,提出了经验似然比检验。检验统计量有以下性质:构造的统计量不需要对方差进行估计;且渐近分布足卡方分布。如果备择假设以n-1/2的速度趋于原假设,统计量仍然可以区分原假设和备择假设。同时,讨论了统计量的最优性。
对于变系数模型中系数函数的拟和优度检验,本文构造了基于残差标志过程的统计量对系数函数是否属于某个参数族进行检验。提出两种方法确定临界值:更新过程的方法和非参数蒙特卡洛逼近的方法。前者用鞅变换得到更新过程的极限分布,且分布的分位数点查表可得,避免了模拟原假设下统计量分布或者渐近分布的大量数值计算。后者是通过非参数蒙特卡洛模拟逼近检验统计量在原假设下的分布,这种逼近的优点是:在小样本的情况下,它很容易被实施;而且在不知道自助近似是否可以逼近原假设分布的时候,它仍然可以使用。
近十年来,对于纵向数据分析常用的混合效应模型的研究越来越多,模型的估计显然是其中最重要的一个问题。非参数混合效应模型是混合效应模型之一,它的非参数部分用来刻划协变量对响应变量的影响,随机效应部分用来表示数据的相关性和离差。在传统的回归模型中,核估计是估计非参数回归函数普遍使用的方法之一,用广义交叉验证法求窗宽和光滑参数的最优性也有相应的研究。但是,在非参数混合效应模型中,用核估计对非参数部分估计,以及用广义交叉验证法选取光滑参数的方法还没有得到相应的研究。本文中,用核估计对非参数混合效应模型中的非参数部分进行估计,给出了核估计和加权最小二乘估计的等价性,同时,用广义交叉验证法得到的窗宽和光滑参数在一定准则下是渐近最优的。
广义线性混合效应模型是另一种在纵向数据分析中常用的模型,模型广泛应用于非正态且相关的数据。在本文中,研究了删除任意一组数据之后的影响诊断问题,包括对于模型的估计以及用Cook距离衡量删除数据之后对估计的影响大小。通过扩展删除=替代等式,提出了简单的算法得到固定效应的参数,随机效应部分以及方差参数的影响诊断。而且,用全部数据和用部分数据拟和模型的两种情况,本文作者都提出了两种不同的方法估计方差分量的参数。此外,本文中还讨论了删除一组数据得到的模型估计和均值漂移模型的估计的等价性,同时给出检验异常值点的检验统计量。而且,说明如果响应变量服从指数分布,基于两种不同估计方法对广义线性混合效应模型影响诊断得到等价的结果。
同样,广义可加混合效应模型对于分析离差和相关数据也是一种非常重要的混合效应模型。已有的参考文献用双重惩罚伪似然对模型中的非参数函数估计,且根据边际似然对方差分量中的参数和光滑参数同时估计。本文中,首先,说明了由边际似然函数得到的固定效应参数的估计等价与响应变量和随机效应的联合似然函数得到的固定效应参数的估计。受此启发,对于可加混合效应模型,得到类似的等价性,也就是由双重惩罚伪似然得到的估计和响应变量和随机效应的联合惩罚似然函数得到的估计等价。而且,对于广义可加混合效应模型提出的方法可以投射为拟和线性混合效应模型和广义线性混合效应模型,根据这一特点,提出了对于可加混合效应模型的稳健估计。
上述所提到的所有方法都通过模拟计算和实例分析说明所提方法的数值分析结果。