数据缺失机制及其检验

来源 :苏州大学 | 被引量 : 0次 | 上传用户:xy479977530
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现实中常存在具有缺失数据时的参数估计或统计推断问题,对这类问题的处理往往是一件复杂工作,既牵涉到统计推断问题,又涉及到缺失数据产生的机制问题。目前的常规处理中,常假定数据的缺失是随机缺失或完全随机缺失,而不考虑非随机缺失的情形。但这种假定是否成立,则不得而知。本文采用了一种模拟方法对数据缺失机制的检验作了初步研究。 本文首先介绍了缺失机制的概念及其概率表示形式,并介绍了logit模型的发展背景;其次在线性回归模型中,分别在MAR和NMAR两种机制下进行了参数估计,结果表明,不同的缺失机制对参数的估计是有影响的。这说明在NMAR机制下,如果将其看成是MAR机制,这样所得的参数估计是有偏的,由此可以看出,在做参数估计前检验缺失机制是很有必要的。最后考虑到logit模型在缺失数据处理中的大量使用,把对缺失机制的检验归结到求一个logit模型的参数估计问题。通过对模型参数估计的显著性的判断,给出了不同缺失机制的检验。文中用三个不同的例子给出了不同假设下检验的做法,这些例子本身同时也说明了这种做法是有效的。
其他文献
非线性方程组的数值解法在实际中有广泛的应用,特别是在各种非线性问题的科学计算中更显出它的重要性.而且,随着计算机的广泛应用,有更多的领域涉及到非线性方程组的求解问题,例如
本文首先在绪论部分阐述了平行数据分析的主要成果及其现状,其中包括平行数据分析的基本理论、平行数据建模的优势和缺点,并介绍了平行数据单位根检验理论的发展历程及其成果
本文在以往的研究基础上,运用数量方法对股指期货推出关于波动性,流动性和市场效率进行了探讨。关于波动性研究,主要根据GARCH类模型考察股指期货推出前后现货市场波动性是否发
编辑距离是A.Levenshtein于1966年提出的,用于判断字符串之间相似程度,等于将一个字符串通过基本变换转化为另一个字符串所需的最小代价。和Hamming距离不同,编辑距离可以计算的
对数理统计有所认识的学者,都知道Bayes统计的重要性.Bayes统计是在与经典统计的争论中逐渐发展起来的.对统计模型而言,基本问题是估计问题,然后以估计的结果进行深入的统计分析.分
学位
数据降维是用低维结构来表达高维数据之间关系的方法。许多非线性降维和流形学习方法如等距映射算法(Isomap),局部线性嵌入法(LLE)以及局部切空间排列法(LTSA)都是通过欧氏距
学位
本文分两章。第一章分两节。第一节中回顾排队论的历史,第二节中先介绍补充变量方法,然后提出本文所要研究的问题。第二章共分两节。第一节中首先介绍具有可选服务的M/G/1排队