论文部分内容阅读
在实际问题中,由于某些抽样个体不愿意提供所需信息、某些不可控的原因导致信息丢失以及调查者未能收集到准确信息等因素而导致大量缺失数据的产生. 事实上,数据缺失在可靠性寿命试验、市场调查、医学研究以及科学试验等中经常发生. 近年来,缺失数据情形的统计推断已成为当今统计界的一个热门研究领域。在有数据缺失的情况下通常的统计方法往往不能直接应用,需要对数据进行必要的处理. 最早用于处理缺失数据的方法是Complete-Case 方法,它是将所有数据缺失的项删除,然后对余下的项构成的“完全样本”按照通常的统计方法进行统计推断。现在处理不完全样本的常用方法是填补法,分为固定填补法和随机填补法两种,它们都是对缺失值进行必要的补充,继而得到“完全样本”,再按照通常的用于完全样本情形的统计方法进行统计推断。
非参数回归模型是一种重要的统计模型,该模型广泛用于解决经济和医学等领域的诸多问题。在完全样本情形,Benedetti 讨论了Priestley-Chao 型固定设计权函数估计的强相合性,Georgiev and Greblicki系统研究了固定设计情形一般权函数估计的均方相合性和完全收敛性;孙东初(回归函数核估计的强相合性[J],数学年刊,1985,6A(4):481-486.),方兆本和赵林城(非参数回归核估计的强相合性[J],应用数学学报,1985,8(3):268-276.),Schuster等在随机设计情形研究了非参数回归模型核估计的大样本性质。 在缺失数据情形,响应变量满足MAR 缺失机制下,Cheng基于核回归补足得到的“完全样本”讨论了随机设计情形非参数回归模型中响应变量均值的渐近正态性,Wang andRao基于核回归补足得到的“完全样本”构造了随机设计情形非参数回归模型响应变量均值的经验似然置信区间,Wang and Rao基于固定补足得到的“完全样本”研究了固定设计情形线性模型回归系数的经验似然置信域的构造。
第二章考虑固定设计下的非参数回归模型,在响应变量有缺失的不完全数据情形,用三种不同的处理方法处理缺失数据,即利用剔除有缺失数据的个体资料方法,利用确定性补足得到的“完全样本”和随机补足得到的“完全样本”,由此给出了回归函数的三种估计,并讨论了估计的强、弱相合性和渐近正态性。
第三章考虑了随机设计下的非参数回归模型,在响应变量有缺失的不完全数据情形,用两种不同的处理方法处理缺失数据,即利用剔除有缺失数据的个体资料方法和回归补足得到的“完全样本”,由此给出了回归函数的两种估计,并讨论了估计的强、弱相合性和渐近正态性。
本文的特色体现在以下几个方面:
1. 在MAR 缺失机制下,首次研究了固定设计情形非参数回归模型回归函数的估计问题,对缺失的响应变量,利用三种不同的缺失数据处理方法给出了回归函数的三种估计,证明了估计的强、弱相合性和渐近正态性。
2. 在MAR 缺失机制下,首次研究了随机设计情形非参数回归模型回归函数的估计问题,对缺失的响应变量,利用两种不同的缺失数据处理方法给出了回归函数的两种估计,证明了估计的强、弱相合性和渐近正态性。