变量的可压缩性及缺失数据下的统计推断

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:chongzimm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在实际研究中,对数据进行合并时常会出现这样一种情况:在分组比较中占优势的一方,在合并后反而不再占优势,这种现象就是著名的辛普森悖论。所以研究变量的可压缩性是非常有必要的,它可以指出哪些背景变量是可以忽略的而哪些是必须要考虑的,它为统计分析的准确性提供了保障。本文首先给出了比值比odds ratios具备简单可压缩性和强可压缩性的定义,然后给出比值比具备强可压缩性的充要条件。接着介绍了logistic回归系数的可压缩性,与介绍比值比可压缩性的思路类似,首先给出logistic回归系数具备简单可压缩性、强可压缩性和有序可压缩性的定义,然后给出充要条件,最后分析了三种可压缩性之间的关系。  在社会调查、医学研究、心理学试验等研究中,常会因为各种原因造成数据缺失,比如被调查者拒绝回答,病人因为自身原因退出医学试验等。缺失数据给统计分析带来一定的困难,近年来,研究缺失数据的统计推断已经成为了一个热门领域。我们总结和归纳了缺失数据的原因、缺失机制和缺失模式,并给出了不同的缺失模型下的处理方法。中外学者在研究缺失数据时用到了很多不同的方法。利用Rubin提出的主分层方法进行因果推断时就需要估计缺失数据。文章以纵向数据研究中死亡删失和“部分依从”下的缺失数据为例,给出了这两种背景下的主分层的理论模型并给出模型的识别估计。这部分的研究可以供其他领域的学者作为参考。
其他文献
学位
学位
学位
学位
学位
学位
移动定位技术是无线移动网络研究的一个重要方向。目前常用的定位方法有:到达时间差方法(OTDOA),到达角度方法(AOA),指纹匹配方法(RFPM)。本论文研究的主要内容是基于“长期演
学位
学位
学位