论文部分内容阅读
在很多科学研究中,由于被调查者不愿提供信息,实验具有破坏性、所费时间非常长、或者因为费用非常昂贵而导致实验没有进行,部分被调查者中途退出实验等等原因,可能会使数据出现缺失的现象。当数据出现缺失时,很多实践操作者常常把有数据缺失的个体剔除,而只使用数据完全观察到的个体的信息,这种方法常常被称之为CC分析,这种方法可能会导致估计是有偏的和估计的效率的损失。因此对于缺失数据,有必要发展新的处理缺失数据的方法。
本文研究了数据缺失时的一些统计问题。主要内容具体如下。
(1)研究了当响应变量随机缺失时部分线性模型回归系数和非参部分的估计问题。我们提出了三种方法估计部分线性模型的回归系数和非参部分,得到了回归系数的估计的渐近正态性,发现非参部分的估计收敛的速度与数据未缺失时是一样的。最后进行了数值模拟来研究所提估计的有限样本性质。
(2)研究了响应变量随机缺失时部分线性模型的检验问题,提出了两种基于经验过程的检验统计量,得到了检验统计量在零假设下和局部对立假设下的渐近性质。我们利用基于随机对称化的重抽样方法来近似检验统计量在零假设下的渐近分布。我们还证明了我们所提的检验可以检测以n-1/2的速度收敛到零假设的对立假设。模拟结果显示所提的方法优于CC方法。
(3)研究了在随机右删失模型下,删失指示变量随机缺失时生存分布函数的半参估计。我们分别提出了生存函数的半参回归、借补和逆概率加权估计,得到了这些估计的一致相合性和渐近收敛于高斯过程的性质。并比较了所提估计与文献中已有的估计的渐近协方差。文章另外还提出了生存函数的一类相合估计,模拟结果显示文章所提估计有很好的有限样本性质。
(4)研究了变量缺失时一般线性模型的检验问题。对当响应变量随机缺失时的一般线性模型的检验问题,我们提出两种类型的得分型检验:CC检验方法和逆概率加权检验方法。我们得出了所提的检验统计量的渐近性质。所提检验是相合的,并且可以检测到以n-r,0≤r≤1/2的速度收敛到零假设的对立假设。模拟结果显示所提的检验方法表现很好。对协变量不可忽略的缺失时一般线性模型的检验问题,文章提出两种检验方法:得分型检验方法和基于经验过程的检验方法。我们得出了所提的检验统计量的渐近性质。所提的得分型检验方法是相合的,并且可以检测到以n-r,0≤r≤1/2的速度收敛到零假设的对立假设。对于基于经验过程的检验方法,我们利用基于随机对称化的重抽样方法来渐近检验统计量在零假设的分布从而确定临界值。所提的基于经验过程的方法检验可以检测以n-1/2的速度收敛到零假设的对立假设。模拟结果显示所提的检验方法表现很好。
(5)研究了在强可忽略条件下平均处理对照差的估计。我们基于拟似然估计方程方法提出平均处理效果的三个估计,得到了这些估计的渐近正态性。模型结果显示所提的估计优于文献中所提的平均处理效果的估计。