论文部分内容阅读
本文主要研究内容是将经验熵(ET)和经验似然(EL)方法分别应用到右删失数据和双边删失数据中,进行参数的统计推断. ET方法和EL方法都是非参数统计方法,他们有极为相似的统计渐近性质和优点.对独立同分布完全数据,他们构造的统计量的渐近分布都是标准卡方分布.这意味着与传统的渐近正态方法相比,他们所构造的参数的置信区间都不需要估计渐近方差;而且这两种方法构造的置信区间的形状不一定是对称的,由数据自动决定的.另一方面这两种方法也有不一样的地方,比如EL方法是可以作Bartlett修正,而ET方法不可以(见Jing, Wood(1996)); ET方法具有稳健性,而EL方法则不具备等等.已往的研究把EL方法从应用到独立同分布完全数据推广到右删失数据,而ET方法是否也可以作类似推广不得而知,本文对这一点作了肯定的回答.另一方面,现有的研究中有把EL方法推广到双边删失数据,然而该推广所定义的对数经验似然比统计量并非渐近收敛到标准χ~2分布,这使得EL方法的优点不复存在,针对这一点,本文研究了如何在双边删失数据下定义经验似然比统计量,使其渐近分布是标准χ~2分布,从而继续保持了EL方法的优点.本文分为三章.第二章介绍与EL方法和ET方法有关的基本概念和性质,在此基础上,详细介绍独立同分布完全数据下的EL方法和ET方法,如何在这两种方法下进行相关统计推断,以及通过他们在重尾分布和非重尾分布下的模拟比较相互间的优劣.进一步介绍了右删失数据下的EL方法,以及研究了如何将ET方法推广至右删失数据,并通过模拟比较了在右删失数据下这两种方法的优劣.而基于他们在稳健性上的差异,模拟中特别考虑了当右删失数据受到污染和未受污染时的情况.本章的模拟表明:1)对来自非重尾分布的独立同分布完全数据, EL方法与ET方法各有优劣;2)对来自重尾分布下的独立同分布数据, ET方法从置信区间实际覆盖率和平均长度两个角度来看均优于EL方法;3)对未受污染的右删失数据,删失比例越高,这两类方法效果越差;在相同的删失比例下, EL方法略优于ET方法;4)对受污染的右删失数据,无论是置信区间实际覆盖率,还是置信区间的平均长度, ET方法的表现均优于EL方法.第三章主要研究在双边删失数据下,如何应用EL方法.文中首先给出一些双边删失数据的实例以及统计描述,接着详细介绍了双边删失数据现有的研究情况.然后研究了在双边删失数据类型下,如何结合半参理论得到感兴趣参数的有效影响函数,以及如何将该有效影响函数应用到EL方法中去,从而对参数进行相应的统计推断.该方法得到的对数经验似然比统计量的渐近分布是标准χ~2分布,这使得在推广经验似然方法到双边删失数据时仍能保持原有的优点.而且该方法适用线性泛函型参数与非线性泛函参数,具有很强的包容性.最后通过模拟实验比较该方法与加权经验似然(WEL)方法,模拟表明该方法比WEL方法得到的置信区间的实际覆盖率更高,平均区间长度更短、更稳定.