论文部分内容阅读
在生态学、人口统计学、软件工程、公共健康和流行病学等领域,总体的大小是一个非常重要的量.为了估计总体大小,捕获再捕获方法是一种被广泛使用且效费比较高的抽样方法.文献中已有的估计方法大都基于条件似然和逆加权估计方程,构造的逆概率加权估计量(Horvitz-Thompson型估计量)可能由于某些权重较小而不太稳定.而且,相应的Wald型置信区间的覆盖概率可能严重低于名义置信水平,置信下限可能会低于观测到的样本量.这些不足促使我们开发表现性能更好的估计方法.考虑到完全似然通常具有较好的性质,本文结合条件似然和经验似然开发了一系列用于估计总体大小的半参数完全似然推断方法.与传统的估计方法相比,该方法的估计效果有明显提高.捕获再捕获数据大致分为两类:连续时间捕获再捕获数据和离散时间捕获再捕获数据.针对连续时间捕获再捕获数据,我们利用Andersen-Gill强度模型建立捕获强度和个体协变量的关系,并综合考虑固定效应模型和混合效应模型.利用经验似然对协变量的分布进行处理,我们针对连续时间捕获再捕获数据建立了关于总体大小的基于经验似然的半参数完全似然推断理论,不仅证明了总体大小的最大经验似然估计量的渐近正态性和半参有效性,还证明了经验似然比统计量渐近卡方分布的性质.与基于条件似然的Horvitz-Thompson型估计量相比,本文所提出的最大经验似然估计量具有较小的均方误差,并且经验似然比置信区间具有更加准确的覆盖概率,置信下限也总是不小于样本量.针对离散时间捕获再捕获数据,我们利用Huggins-Alho模型建立捕获概率和个体协变量的关系.我们重点考虑协变量存在缺失的情形,在随机缺失的机制下提出关于总体大小的半参数完全似然推断理论,不仅研究了总体大小的最大经验似然估计量和经验似然比统计量的渐近性质,而且通过模拟研究和实际数据的分析来说明这些估计量的有效性.值得注意的是,与传统的逆概率加权法和多重插补法相比,本文所提的半参数完全似然方法不需要对入样概率做任何的参数或非参数假设,进而估计结果对入样概率潜在的错误假定更稳健.最后,我们将个体行为因素纳入Huggins-Alho模型,在一般的模型假设下提出总体大小的半参数完全似然推断方法.我们不仅研究了最大经验似然估计量和经验似然比统计量的渐近性质,而且通过数值分析重点考察个体行为因素对所提估计量的影响.