论文部分内容阅读
缺失数据现象在现实生活中经常发生,如民意调查、市场调查、医药研究等领域常有数据缺失.在有数据缺失的情况下通常的统计方法往往不能直接应用,需要对数据进行必要的处理,处理带有缺失数据的不完全样本时常常需要对缺失值进行补充,继而得到“完全样本”,再按通常的统计方法进行推断,缺失数据情形的统计推断是当今统计界一个热门的研究领域(Little & Rubin, Statistical analysis with missing data[M], New York: John Wiley & Sons2002).在有数据缺失的回归模型的研究中,通常使用的填补方法有线性回归填补法,半参数回归填补法和非参数回归填补法. Cheng (Nonparametric estimation of mean functionals withdata missing at random, J. Amer. Statist. Assoc., 89, 81-87.)基于非参数核回归填补方法得到的“完全样本”给出了随机设计情形非参数回归模型中响应变量均值的渐近正态性,并得到了其渐近方差的一个相合估计. Wang and Rao (Empirical likelihood for linear regressionmodels under imputation for missing responses[J]. The Canadian Journal of Statistics, 2001, 29(4):597-608.)基于固定补足得到的“完全样本”研究了固定设计情形线性模型回归系数的经验似然置信域的构造. Wang and Rao (Empirical likelihood-based inference under imputation formissing response data, Ann. Statist., 30, 896-924.)在随机设计及缺失数据情形构造了非参数回归模型响应变量均值的经验似然置信区间(域),他们采用的是通常的回归填补法补足缺失数据,再利用填补后的“完全数据”构造回归系数的经验似然比统计量,并证明了此经验似然比统计量的极限分布为加权卡方分布,在利用该结果构造回归系数的经验似然置信区间(域)时需要进行调整,这需要估计调整系数,导致经验似然置信区间(域)精度的降低.本文在第二章中研究了随机设计及响应变量有缺失情形非参数回归模型的统计推断,我们基于非参数回归填补法和逆概率权填补法得到了非参数回归模型中非参数回归函数m(x)在给定x = x0∈Rp下的估计,并证明了估计的渐近正态性,利用此结果构造了其基于正态逼近的渐近置信区间(域).在第三章利用逆概率权填补法得到的“完全样本”构造了随机设计及响应变量有缺失情形非参数回归模型中非参数回归函数m(x)在给定x = x0∈Rp下的经验似然比统计量,证明了经验似然比统计量的极限分布为卡方分布,利用此结果构造了参数分量和非参数分量的经验似然置信区间(域),我们在构造经验似然置信区间(域)时不需要调整,从而可以提高经验似然置信区间(域)的覆盖精度.总体差异比较是医学、经济和教育领域经常遇到的课题,秦永松和赵林城(Semi-parametric likelihood confidence intervals forvarious differences of two populations[J], Statistics and Probability Letters, 1997, 33(2): 135-143;两总体分位数差异的经验似然比置信区间[J],数学年刊(A辑), 1997, 18(6): 687-694;两样本分位数差异的半经验似然比检验[J],应用数学学报, 1998, 21(1): 103-112;Empiricallikelihood ratio confidence intervals for various differences of two populations[J], System Scienceand Mathematical Sciences, 2000, 13: 23-30)在完全样本情形提出了构造各种总体差异指标的经验似然置信区间的系统理论. Qin & Zhang (Empirical likelihood confidence intervals fordifferences between two datasets with missing data[J], Pattern Recognition Letters, 2008, 29(6):803-812)在MCAR缺失机制下的不完全样本情形构造了两非参数总体差异指标的加权经验似然置信区间.本文在第四章将Qin and Zhang的结果推广到MAR缺失机制情形,利用逆概率权填补法得到“完全样本”,在此基础上构造了随机设计及响应变量有缺失时两线性模型总体差异指标的经验似然比统计量,证明了经验似然比统计量的极限分布为卡方分布,利用此结果构造了差异指标的经验似然置信区间(域),我们在构造经验似然置信区间(域)时不需要调整,从而可以提高经验似然置信区间(域)的覆盖精度.本文的特色体现在以下两个方面:1.首次研究了随机设计及响应变量有缺失情形非参数回归模型的统计推断,我们基于非参数回归填补法和逆概率权填补法得到了非参数回归模型中m(x0)的估计,并证明了估计的渐近正态性,利用此结果构造了其基于正态逼近的渐近置信区间(域).2.在讨论随机设计及响应变量有缺失情形非参数回归模型中m(x0)的经验似然置信区间(域)的构造时和随机设计及响应变量有缺失时两线性模型总体差异指标的经验似然置信区间(域)的构造时,采用了逆概率权填补法,证明了基于此填补法得到的m(x0)和两线性模型总体差异指标的经验似然比统计量的极限分布为卡方分布,利用此结果构造参数分量和非参数分量的经验似然置信区间(域)时不需要调整,从而可以提高经验似然置信区间(域)的覆盖精度.