论文部分内容阅读
现实中常存在具有缺失数据时的参数估计或统计推断问题,对这类问题的处理往往是一件复杂工作,既牵涉到统计推断问题,又涉及到缺失数据产生的机制问题。目前的常规处理中,常假定数据的缺失是随机缺失或完全随机缺失,而不考虑非随机缺失的情形。但这种假定是否成立,则不得而知。本文采用了一种模拟方法对数据缺失机制的检验作了初步研究。
本文首先介绍了缺失机制的概念及其概率表示形式,并介绍了logit模型的发展背景;其次在线性回归模型中,分别在MAR和NMAR两种机制下进行了参数估计,结果表明,不同的缺失机制对参数的估计是有影响的。这说明在NMAR机制下,如果将其看成是MAR机制,这样所得的参数估计是有偏的,由此可以看出,在做参数估计前检验缺失机制是很有必要的。最后考虑到logit模型在缺失数据处理中的大量使用,把对缺失机制的检验归结到求一个logit模型的参数估计问题。通过对模型参数估计的显著性的判断,给出了不同缺失机制的检验。文中用三个不同的例子给出了不同假设下检验的做法,这些例子本身同时也说明了这种做法是有效的。