论文部分内容阅读
经验似然是一种现代非参数统计方法,由Owen(1988,1990)正式提出后,很多学者对它做了深入的研究.见Owen(2001)及其它参考文献.经验似然具有很多优点,如不需要参数分布假定,不用估计方差,置信域形状由数据自动决定,置信域是保值的和对参数变换不变的,可Bartlett修正的,能方便地利用辅助信息,等等.由于其灵活性和有效性,现在这种方法已经得到越来越广泛的应用.其中,在基于密度比模型进行半参数统计推断时,经验似然已被广泛使用,但仍有一些值得研究的问题.如在对目标参数做推断时,由于基于密度比模型的对偶经验似然(Keziou和Leoni-Aubin,2008)和经验似然(Qin和Lawless,1994)有相同的极值点和极值,通常参数估计就基于“对偶似然”(Keziou和Leoni-Aubin,2008),因为它有显式表达式且易于计算,但对偶似然却不是真正的似然.与之相比,标准的经验似然还可以方便地把辅助信息吸收到似然中(Qin和Lawless,1994;Qin等,2015).一个自然的问题是:基于对偶似然的统计推断结果和基于标准的经验似然的结果总是相同的吗?这样做是否会有效率损失?第二章从理论和数值模拟上,对这两种方法做了详细的比较研究.本论文的一个贡献是,我们发现,从覆盖精度来说,对无偏或适当有偏的总体而言,两者的区间估计是可比的,但当总体严重偏倚时,经验似然是明显优于对偶似然的.关于加拿大木材数据的一个实例分析用来佐证我们的发现.此外,在有限总体推断问题中,历史总体信息通常是最易获取的辅助信息之一,可由历史数据得到或者估计出来.第三章继续讨论了利用此类辅助信息的经验似然推断问题.以基准分布的总体均值的点估计和区间估计为例,直觉上感觉利用了辅助信息的经验似然推断结果要比基于对偶似然的好,但有限样本的表现真的如此吗?这样做会有显著的效率提升吗?对这些问题的回答构成了本论文的第三章.另外,半参数、非参数模型及方法在小域估计领域正日益受到人们的重视.如何把经验似然合适地引入进来,以及当经典的经验最优线性无偏预测(EBLUP)表现不佳时,使用非参数的经验似然是否有优势?第四章借助经验似然来解决上述问题.小域估计起源于抽样调查.“小域”通常指从总体(也称大域)划分出来的子总体,由于抽样设计可能导致其中一些小域样本量很少甚至为零,从而无法直接对人们关心的参数构造出可靠的估计量,由此自然产生了小域估计问题.常用的做法是通过“借用信息”(borrow strength)来构造可靠的小域估计量.在借用信息的基于模型的方法中,嵌套误差回归模型(Battese等,1988,NER)是其中应用最为广泛的模型之一.对此模型,经典的EBLUP是最为常用的对小域均值的估计(预测).为了减少EBLUP对NER模型的依赖,本论文的又一贡献是提出了一种新的变换的NER模型对小域数据建模,并指出新变换的调整参数的极大似然估计是相合的.参考Duan(1983)的污染估计(smearing estimation)方法和Chen等(2008)的改进的经验似然方法,并依协变量的辅助信息的获取程度,我们提出了两种在新模型下的小域均值估计方法.通过模拟及对加拿大统计局提供的劳动与收入动态调查数据(2014年)分析,我们发现,新的方法与已有的一些方法如EBLUP相比,具有一定的优势,特别是对于小样本.第五章在第四章的基础上继续讨论了小域估计中的校准问题.实际应用中,为了防止模型误判以及出于行政部门之间数据发布的一致性的需要,通常要求基于模型得到的小域估计的总和与基于大域得到的更加可靠的直接估计值相一致.调整估计值以纠正这个问题的过程称为校准.本论文的最后一个贡献是,我们提出了一种针对小域均值的内部校准方法,进而使用一种参数自助法来计算校准估计的均方误.并以上一章中的劳工收入数据为基础,设计了一个基于真实数据的模拟研究,进而与其它的校准方法做了比较,来说明所提方法的功效.