论文部分内容阅读
在许多实际应用中比如工农业生产、药物测试、抽样调查等各种科学试验实践,由于人为的因素或者测量工具测量手段等方面的限制,在对感兴趣变量进行测量时,往往会出现测量不准确,导致得到的数据存在测量误差。大量实践以及文献证明,如果忽略测量误差,采用通常的统计方法进行分析往往会对最终结果造成极大的不良影响。这类充分考虑数据中测量误差的影响而建立的统计模型称为“测量误差模型”(Errors-in-Variables Model)。由于在实际问题中测量误差数据大量存在,所以测量误差模型(EV模型)是更符合实际情况的模型,但是由于在统计推断和分析上的复杂性,它的理论研究比较困难,因此对该模型的估计与检验问题进行深入的研究有着非常重要的实际意义。
本文主要结果包括以下几个方面的工作:
1.考虑了两种不同可识别条件(误差方差比已知和测量误差方差已知)下的线性EV模型,对自变量不但带有观测误差,而且随机缺失,其缺失概率未知的情形,利用核估计方法估计出缺失概率,再利用逆概率加权方法对缺失的自变量进行借补,证明了此种情况下模型参数估计的相合性以及渐近正态性。模拟表明文中提出的估计与只考虑完全数据下的估计相比,偏差接近而渐近方差有所降低。另外还模拟比较了在用真实的缺失概率、核方法估计的缺失概率以及用参数模型估计缺失概率三种情况下估计,模拟表明在正确给出缺失概率模型的情况下,后两种方法得到的估计比用真实的缺失概率还要好。因此在缺失概率未知的情况下,采用其非参数估计代替并不会影响模型的估计性质。
2.众所周知,经验似然在统计推断方面有一定的优势,它在构造置信区域时不需要估计渐近方差,并且置信区域形状由数据情况决定。对于自变量存在随机缺失且识别条件为误差方差比已知的线性EV模型,我们利用逆概率加权的方法处理缺失数据,进而基于逆概率加权估计方程构造模型参数的经验似然比统计量,证明了该统计量在真值以及局部备择下的渐近分布。由于在误差方差已知的识别条件下得到的估计方程的解不唯一,因此构造了带约束的经验似然比置信区域,并证明了该区域是渐近凸且渐近相合的。模拟表明在大部分情况结果表明估计线性部分参数时是否考虑测量误差对于非参数部分的检验功效影响不大。