纵向数据模型中的模型检验和估计问题

来源 :中国科学院数学与系统科学研究院 | 被引量 : 0次 | 上传用户：mx520ht

【摘要】

：

变系数回归模型是纵向数据分析的重要工具。数据分析的主要目的是分析响应变景与时间和协变=阜=之间的关系。很明显，对模型做拟和优度检验是非常重要和有意义的。基于残差的检

【作者】

：

许王莉

【机构】

：

中国科学院数学与系统科学研究院

【出处】

：

中国科学院数学与系统科学研究院

【发表日期】

：

2006年期

【关键词】

：

纵向数据模型模型检验变系数模型广义交叉验证法广义线性混合效应模型

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

变系数回归模型是纵向数据分析的重要工具。数据分析的主要目的是分析响应变景与时间和协变=阜=之间的关系。很明显，对模型做拟和优度检验是非常重要和有意义的。基于残差的检验统计量是经常使用的检验方法之一。由于模型中的系数函数是时间的非参数函数，本文作者必须使用非参数光滑方法对它进行估计，所以用已有的传统回归模型的检验方法功效可能不是很好。而且，大部分已有的检验统计量是刻度不变的，它的极限分布需要对方差进行估计。然而，对它的估计依赖具体的模型，一般来说，在备择假设下得到的方差估计比原假设下得到的要大。这可能会降低检验的功效。为了克服上述问题，在本文中，提出了经验似然比检验。检验统计量有以下性质：构造的统计量不需要对方差进行估计；且渐近分布足卡方分布。如果备择假设以n-1/2的速度趋于原假设，统计量仍然可以区分原假设和备择假设。同时，讨论了统计量的最优性。　　对于变系数模型中系数函数的拟和优度检验，本文构造了基于残差标志过程的统计量对系数函数是否属于某个参数族进行检验。提出两种方法确定临界值：更新过程的方法和非参数蒙特卡洛逼近的方法。前者用鞅变换得到更新过程的极限分布，且分布的分位数点查表可得，避免了模拟原假设下统计量分布或者渐近分布的大量数值计算。后者是通过非参数蒙特卡洛模拟逼近检验统计量在原假设下的分布，这种逼近的优点是：在小样本的情况下，它很容易被实施；而且在不知道自助近似是否可以逼近原假设分布的时候，它仍然可以使用。　　近十年来，对于纵向数据分析常用的混合效应模型的研究越来越多，模型的估计显然是其中最重要的一个问题。非参数混合效应模型是混合效应模型之一，它的非参数部分用来刻划协变量对响应变量的影响，随机效应部分用来表示数据的相关性和离差。在传统的回归模型中，核估计是估计非参数回归函数普遍使用的方法之一，用广义交叉验证法求窗宽和光滑参数的最优性也有相应的研究。但是，在非参数混合效应模型中，用核估计对非参数部分估计，以及用广义交叉验证法选取光滑参数的方法还没有得到相应的研究。本文中，用核估计对非参数混合效应模型中的非参数部分进行估计，给出了核估计和加权最小二乘估计的等价性，同时，用广义交叉验证法得到的窗宽和光滑参数在一定准则下是渐近最优的。　　广义线性混合效应模型是另一种在纵向数据分析中常用的模型，模型广泛应用于非正态且相关的数据。在本文中，研究了删除任意一组数据之后的影响诊断问题，包括对于模型的估计以及用Cook距离衡量删除数据之后对估计的影响大小。通过扩展删除=替代等式，提出了简单的算法得到固定效应的参数，随机效应部分以及方差参数的影响诊断。而且，用全部数据和用部分数据拟和模型的两种情况，本文作者都提出了两种不同的方法估计方差分量的参数。此外，本文中还讨论了删除一组数据得到的模型估计和均值漂移模型的估计的等价性，同时给出检验异常值点的检验统计量。而且，说明如果响应变量服从指数分布，基于两种不同估计方法对广义线性混合效应模型影响诊断得到等价的结果。　　同样，广义可加混合效应模型对于分析离差和相关数据也是一种非常重要的混合效应模型。已有的参考文献用双重惩罚伪似然对模型中的非参数函数估计，且根据边际似然对方差分量中的参数和光滑参数同时估计。本文中，首先，说明了由边际似然函数得到的固定效应参数的估计等价与响应变量和随机效应的联合似然函数得到的固定效应参数的估计。受此启发，对于可加混合效应模型，得到类似的等价性，也就是由双重惩罚伪似然得到的估计和响应变量和随机效应的联合惩罚似然函数得到的估计等价。而且，对于广义可加混合效应模型提出的方法可以投射为拟和线性混合效应模型和广义线性混合效应模型，根据这一特点，提出了对于可加混合效应模型的稳健估计。　　上述所提到的所有方法都通过模拟计算和实例分析说明所提方法的数值分析结果。

其他文献

带量测噪声的非线性系统的辨识与适应调节

非线性系统广泛出现在人类认识世界改造世界的实践活动中，因而，这类系统的辨识与控制问题具有重要的意义.本文讨论Wiener和Hammerstein这两类特殊而又常见的非线性系统的辨识问

学位

非线性系统递推辨识算法适应调节控制Wiener系统Hammerstein系统噪声量测

产学融合下的“现代学徒制”营销人才培养模式设计

面对市场营销人才培养出现供求脱节的结构性难题,现代职业教育亟需探索一条基于深度产教融合下的现代学徒制人才培养模式。本文提出了通过建立产教融合人才培养平台,采用现代

期刊

营销人才学徒制模式设计产学融合培养模式人才培养平台模式需要教学改革人力资源公司营销策划

充分发挥主题图功能为课堂教学服务

《数学课程标准解读》指出在数学教学中,应“让数学背景包含在学生熟悉的事物和具体情景之中,并与学生已经了解或学习过的数学知识相关联,特别是与学生生活中积累的常识性知

期刊

基于多元分布识别不同索赔的奖惩系统

随着经济与科技的快速发展,机动车已经成为现代社会中不可缺少的一部分,因此驾驶员对于汽车保险的需求日益增加,汽车保险已经是非寿险的一个重要分支,在许多国家甚至是总保费收入的最大贡献部分。为了各方都满意,汽车保险采用奖惩系统(Bonus-malus system简称BMS)来使投保人所缴纳的保费与其风险相匹配。也就是说,保费收取往往极大地依赖于该保单过去的理赔记录。在这样的经验费率系统中,投保人会因没

学位

废旧纺织品的近红外光谱分析模型

为了建立废旧纺织品的近红外光谱分析模型，为废旧纺织品的精细分拣分级打下基础。本论文使用多模型方法为基本工具，分别建立了废旧纺织品的定性判别模型和纺织品棉含量的定量预

学位

废旧纺织品棉含量预测近红外光谱分析模型支持向量机判别准确率

分段连续型延迟微分方程及随机延迟微分方程数值稳定性分析

本文主要涉及分段连续型延迟微分方程(EPCA)及随机延迟微分方程(SDDE)数值解的稳定性。这两类方程在物理、生物和控制中有着广泛的应用。　　经典的分段连续型延迟微分方程

学位

分段连续

基于LSSVM—ARMA组合模型的时间序列预测

时间序列模型的构建以及预测不同于一般的计量经济模型，因为时间序列变量的预测不取决于其它的自变量，而是取决于其自身在过去的规律，这种规律又具有某种随机性，由此决定了不能用

学位

时间序列时间序列支撑向量机支撑向量机最小二乘最小二乘自回归模型自回归模型移动平均模型移动平均模型计量经济模型计量经济模型

Lorentz空间形式中超曲面和曲面的共形几何

本文主要研究了Lorentz空间形式中的超曲面和曲面的共形几何.为使问题清晰起见，文章将基本理论的重点放在类空超曲面上。我们可以把Lorentz空间形式看作共形空间Qn1的子集，从而

学位

空超曲面共形空间共形几何

谈普通学校管乐队的组织与训练

近几年来,我国经济快速发展,人们在不断追求更高品质的生活的同时,也随着素质教育的推行,常借艺术这一途径,促进人才的培养,很多学校开始组建各种文娱社团,管乐队也是其中之

期刊

学校管乐队组织训练

《桀饰》

请下载后查看，本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.

期刊

纵向数据模型中的模型检验和估计问题

与本文相关的学术论文