缺失数据情形两类统计模型的统计推断

来源 :广西师范大学 | 被引量 : 2次 | 上传用户:z987z654z123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
缺失数据现象在现实生活中经常发生,如民意调查、市场调查、医药研究等领域常有数据缺失.在有数据缺失的情况下通常的统计方法往往不能直接应用,需要对数据进行必要的处理,处理带有缺失数据的不完全样本时常常需要对缺失值进行补充,继而得到“完全样本”,再按通常的统计方法进行推断,缺失数据情形的统计推断是当今统计界一个热门的研究领域(Little & Rubin, Statistical analysis with missing data[M], New York: John Wiley & Sons2002).在有数据缺失的回归模型的研究中,通常使用的填补方法有线性回归填补法,半参数回归填补法和非参数回归填补法. Cheng (Nonparametric estimation of mean functionals withdata missing at random, J. Amer. Statist. Assoc., 89, 81-87.)基于非参数核回归填补方法得到的“完全样本”给出了随机设计情形非参数回归模型中响应变量均值的渐近正态性,并得到了其渐近方差的一个相合估计. Wang and Rao (Empirical likelihood for linear regressionmodels under imputation for missing responses[J]. The Canadian Journal of Statistics, 2001, 29(4):597-608.)基于固定补足得到的“完全样本”研究了固定设计情形线性模型回归系数的经验似然置信域的构造. Wang and Rao (Empirical likelihood-based inference under imputation formissing response data, Ann. Statist., 30, 896-924.)在随机设计及缺失数据情形构造了非参数回归模型响应变量均值的经验似然置信区间(域),他们采用的是通常的回归填补法补足缺失数据,再利用填补后的“完全数据”构造回归系数的经验似然比统计量,并证明了此经验似然比统计量的极限分布为加权卡方分布,在利用该结果构造回归系数的经验似然置信区间(域)时需要进行调整,这需要估计调整系数,导致经验似然置信区间(域)精度的降低.本文在第二章中研究了随机设计及响应变量有缺失情形非参数回归模型的统计推断,我们基于非参数回归填补法和逆概率权填补法得到了非参数回归模型中非参数回归函数m(x)在给定x = x0∈Rp下的估计,并证明了估计的渐近正态性,利用此结果构造了其基于正态逼近的渐近置信区间(域).在第三章利用逆概率权填补法得到的“完全样本”构造了随机设计及响应变量有缺失情形非参数回归模型中非参数回归函数m(x)在给定x = x0∈Rp下的经验似然比统计量,证明了经验似然比统计量的极限分布为卡方分布,利用此结果构造了参数分量和非参数分量的经验似然置信区间(域),我们在构造经验似然置信区间(域)时不需要调整,从而可以提高经验似然置信区间(域)的覆盖精度.总体差异比较是医学、经济和教育领域经常遇到的课题,秦永松和赵林城(Semi-parametric likelihood confidence intervals forvarious differences of two populations[J], Statistics and Probability Letters, 1997, 33(2): 135-143;两总体分位数差异的经验似然比置信区间[J],数学年刊(A辑), 1997, 18(6): 687-694;两样本分位数差异的半经验似然比检验[J],应用数学学报, 1998, 21(1): 103-112;Empiricallikelihood ratio confidence intervals for various differences of two populations[J], System Scienceand Mathematical Sciences, 2000, 13: 23-30)在完全样本情形提出了构造各种总体差异指标的经验似然置信区间的系统理论. Qin & Zhang (Empirical likelihood confidence intervals fordifferences between two datasets with missing data[J], Pattern Recognition Letters, 2008, 29(6):803-812)在MCAR缺失机制下的不完全样本情形构造了两非参数总体差异指标的加权经验似然置信区间.本文在第四章将Qin and Zhang的结果推广到MAR缺失机制情形,利用逆概率权填补法得到“完全样本”,在此基础上构造了随机设计及响应变量有缺失时两线性模型总体差异指标的经验似然比统计量,证明了经验似然比统计量的极限分布为卡方分布,利用此结果构造了差异指标的经验似然置信区间(域),我们在构造经验似然置信区间(域)时不需要调整,从而可以提高经验似然置信区间(域)的覆盖精度.本文的特色体现在以下两个方面:1.首次研究了随机设计及响应变量有缺失情形非参数回归模型的统计推断,我们基于非参数回归填补法和逆概率权填补法得到了非参数回归模型中m(x0)的估计,并证明了估计的渐近正态性,利用此结果构造了其基于正态逼近的渐近置信区间(域).2.在讨论随机设计及响应变量有缺失情形非参数回归模型中m(x0)的经验似然置信区间(域)的构造时和随机设计及响应变量有缺失时两线性模型总体差异指标的经验似然置信区间(域)的构造时,采用了逆概率权填补法,证明了基于此填补法得到的m(x0)和两线性模型总体差异指标的经验似然比统计量的极限分布为卡方分布,利用此结果构造参数分量和非参数分量的经验似然置信区间(域)时不需要调整,从而可以提高经验似然置信区间(域)的覆盖精度.
其他文献
延迟积分微分方程(DIDEs)在社会的各个方面是广泛存在的,如经济、生物、物理、工程及航天航空等领域。近年来,延迟积分微分方程的稳定性理论得到了极大的发展,使得延迟积分微分
农学专业课的教学方法都应该是将理论的作用实用化,要激发学生的学习兴趣,强调理论课的重要性,专业实践是理论教学的延伸,从而达到提高学生专业技能的教学目的。
本文主要研究了两种特殊图类的染色问题:不含三角形的平面图的列表染色,交叉数为1的图的在线列表染色.  不含三角形的平面图的染色问题吸引了很多学者的注意.Gr(o)tzsch的一
在小学数学教学过程中,一个优秀的导学案可以达到事半功倍的效果.优秀的导学案所要达到的要求有很多,例如要结合学生的实际情况、学校的学习氛围等等很多方面的因素.为了能够
小学语文教学的魅力,离不开生活,在教学识字、阅读、口语交际、习作等都与现实生活紧密相连.因此,关注课堂教学生活化成为了课改的基本趋势.
目前,中国已成为世界上遭遇反倾销最多的国家,我国面临着严重的反倾销局势,为此我国应该采取一些切实有效的对策积极应对反倾销。 At present, China has become the countr
延迟微分方程广泛应用于科技、工程、经济管理以及生态、环境、人口、交通等领域。由于其解析解在大多数情形难以获得,因此延迟微分方程的数值分析研究近年已引起学者们的广泛
在初中物理人教版的授课研究中,课堂的情境教学实现了较高的实践价值,利用情境教学极高的操作演示性,学生可以更直接地了解所学的知识,进而增强对物理知识系统的合理构建.本
考虑一个从底部持续加热的平行夹层,其中充满某种流体。由于热膨胀,底部的液体会由于温度的升高有向上的趋势,当上下温差较小时,流体自身的黏性阻止了热对流运动的产生,这时流体内
温家宝总理在十届全国人大二次会议上,作政府工作报告。这个报告,贯彻了邓小平理论和“三个代表”重要思想,贯彻了党的十六大和十六届三中全会精神,通篇体现了以人为本,体现