论文部分内容阅读
缺失数据在社会学、经济学、心理学和生物医学等实际研究领域中都是普遍存在的。缺失数据的影响显而易见,它不仅可能造成估计量的偏差,还会导致估计量方差的扭曲,使传统的统计方法的效率降低。如何对缺失数据进行处理进而提高数据质量一直是国际统计学界热点讨论的课题之一。尽管目前存在许多不同的处理缺失数据的方法,但用极大似然EM算法研究缺失数据的问题是近年来统计学研究中较为活跃的一个研究热点。EM算法是研究基于不完全数据极大似然估计的有效方法,也是研究随机效应模型极大似然估计的有效方法。本文对带有不可忽略缺失数据的非线性随机效应模型提出用极大似然EM算法来处理缺失数据的计算方法,并鉴于相关资料给出了MH抽样的具体步骤进而得到相应参数的极大似然估计,并且提出了模型参数极大似然估计的随机逼近算法,同时在参数估计的基础上利用百分位数Bootstrap方法构造置信区间。最后进行模拟研究,其研究成果对实际应用工作者有一定的参考价值。
本文的主要创新点包括:
1根据数据缺失的特点,建立了缺失数据机制模型;
2通过视模型中的随机效应为假想的缺失数据和应用Metropolis-Hastings(MH)算法,提出了模型参数极大似然估计的Monte-Carlo EM(MCEM)算法;
3基于模型给定的假设分布,可以导出随机效应的后验分布,因而对随机效应可以不用MH抽样,进而可以提高参数的估计精度,发展了模型中未知参数的极大似然估计方法;
4在基于MCEM算法的基础上提出随机逼近算法计算模型参数的极大似然估计;
5根据文中得到的理论结果,进行模拟研究,说明了该方法的可行性。