论文部分内容阅读
纵向数据分析是当前统计学的热点课题之一,分析的目的是探索各受试单元在不同时间或空间上的重复观测数据的统计性质。在纵向数据中不可避免地存在异常数据,已有一些统计学家对纵向数据模型进行统计诊断。Banerjee&Frees(1997),Lesafire & Verbeke(1998)用影响曲率对线性随机效应模型进行了分析;Banerjee(1998),nans et al(2001)讨论了线性随机效应模型中的Cook距离;Chi&Reinsel(1989)检验了线性纵向数据模型中自相关性的存在性。但是,对存在自相关的纵向数据模型中自相关系数的诊断问题还没有文献研究,本文系统研究该问题。
第二章利用影响曲率对具有AR(1)误差的非线性随机效应模型的自相关系数的扰动诊断进行分析。首先在自相关系数无扰动的情况之下,推导出非线性随机效应模型参数的极大似然估计以及模型的对数似然函数关于参数的二阶导数的表达式;其次在自相关系数扰动的情况下,导出受扰动的模型的对数似然函数关于参数的相关导数的表达式,从而得到了影响曲率的表达式;最后利用血浆药物渗透数据(Davidian & Gilinan,1995)和随机模拟来说明分析方法的有效性。
第三章利用影响曲率对具有AR(1)误差的非线性混合效应模型的自相关系数的扰动诊断进行分析。首先在自相关系数无扰动的情况之下,推到出非线性混合模型参数的极大似然估计以及模型的对数似然函数关于参数的二阶导数的表达式;其次在自相关系数扰动的情况下,导出受扰动的模型的对数似然函数关于参数的相关导数的表达式,也得到了影响曲率的表达式。鉴于非线性混合效应模型本身所特有的复杂性,提出一种修正的Cook距离形式,并对具有AR(1)误差的非线性混合效应模型的影响单元进行统计诊断.最后利用桔树生长数据和随机模拟来说明分析方法的应用。
第四章为了说明我们的统计诊断量的有效性,本章我们将通过模拟计算来进一步说明我们方法的有效性。
综上所述,本文比较深入系统地对具有AR(1)误差的非线性随机效应模型和非线性混合效应模型中的自相关系数扰动进行了分析,并且提出非线性混合效应模型中Cook距离,数值实例和随机模拟表明这些诊断统计量都是很有效的。