论文部分内容阅读
背景:在医学研究领域,以二分类数据为结局的资料类型十分常见。对于此类数据的分析,应用中通常会给出效应量及效应量的置信区间,其中最常用的效应量包括:率、率差、率比、优势比等。单样本率的置信区间估计方法较多,以Wilson Score法的应用最为广泛,但均存在极端率情形下(接近0%或100%)置信区间覆盖率急剧下降的情况,即“downward spikes”现象。此外,不同方法还有着自身的局限,如Agresti-Coull提出的对于样本成功例数和失败例数分别加2的Agresti and Coull add 4 CI以及于样本成功例数和失败例数分别加z2的Agresti and Coull add z2 CI,Guan提出的广义Score法(Generalized Score CI),以及Yu提出的基于中点校正的Score法(Improved Score interval with a Modified Midpoint)等,虽然从不同的方面对Wilson Score CI有所改善,但是仍存在覆盖率不稳定、区间宽度过大等问题。在精确法中,Clopper-Pearson CI可以保证区间覆盖率不低于所设定的检验水准,但是该方法过于保守,Mid-P CI相对于Clopper-Pearson CI有所改善,但是结果仍较保守,而且精确法的计算量大,在应用上受到了一定的限制;Rubin和Schenke基于贝叶斯理论提出了Jeffrey CI,该方法能够解决在极端率的情况下区间覆盖率急剧下降的问题,但是其区间估计的结果过于保守,而且当事件发生率不接近0或者1时同样会出现“downwardspikes”现象。因此,目前并没有一种公认较好的单样本率的置信区间估计方法。两独立样本率差置信区间的构建相对于单样本率的情况更加复杂,虽然当前已有数十种方法被提出,但是这些方法自身均存在一定的不足。目前最常用的是Newcombe与1998年提出的Newcombe-Wilson Score CI,这种方法也受到了美国临床实验室标准化协会以及FDA指南的推荐。但是,当率接近0或100%的时候,Newcombe-Wilson Score CI较为保守。目的:本研究旨在基于Cornish-Fisher展开式结合Score法思想提出一种新的单样本率置信区间构建方法,并进一步将新方法推广到两独立样本率差置信区间的构建中,以期较现有方法的统计性能有明显改善。方法:(1)新方法的提出Comish-Fisher展开式是一种用于估计概率分布分位数的渐近展开方法,由Cornish和Fisher两位著名统计学家于1960年提出。其主要思想是通过概率分布的前n阶累积量和标准正态分布的分位数来近似估计概率分布的分位数。Wilson Score CI在极端率的条件下可能会出现覆盖率急剧下降的问题,其主要原因是当事件发生率接近0或1时,二项分布并非近似服从正态分布。因此,本研究考虑提出一种新的置信区间构建思想,在构建单样本率的置信区间时,舍弃传统的正态近似法,直接采用Cornish-Fisher展开式估计二项分布的分位数,希望以此避免近似正态分布时产生误差,提高结果的精确性。本研究将基于这种新思想构建的单样本率的置信区间命名为Cornish-Fisher CI。MOVER法(Method of Variance Estimate Recovery)是一种常用的率差/率比置信区间的构建策略,其主要思想是通过方差重估计(Variance Estimate Recovery)的方法将单样本率的置信区间“杂交”成两样本率差/率比的置信区间。我们将本研究提出的置信区间构建思想结合MOVER法构建出一种新的两独立样本率差的置信区间,并命名为Cornish-Fisher hybrid CI。(2)模拟研究在比较各种置信区间估计方法的优劣时,采用的评价指标包括置信区间的区间覆盖率、置信区间宽度、尾侧不覆盖率及其比值、最小区间覆盖率、均方误、平均置信区间宽度以及方法的计算复杂程度。对于单样本率的置信区间估计,本研究共纳入8种常见的方法包括:Wilson Score CI、Wald CI、Modified Midpoint CI、Generalized Score Cl、Agresti-Coull add z2 CI、Jeffrey CI、Mid-P CI、Randomized Plausible Interval,与新方法Cornish-Fisher CI进行模拟比较。对于两独立样本率差的置信区间估计,本研究重点考察当前使用最广泛的方法Newcombe-Wilson Score CI与新方法Cornish-Fisher hybrid CI 的优劣。结果:对于单样本率的置信区间估计,本研究提出的新方法在平均置信区间覆盖率、均方误及平均置信区间宽度等方面均表现最优,即在纳入比较的几种方法中,新方法在保证平均置信区间覆盖率的情况下,它的均方误及平均置信区间宽度是最小的。对于两独立样本率差的置信区间估计,当两事件发生率π1和π2接近0或1,即在(0,0.2](?)[0.8,1)范围内时,当前广泛推荐使用的Newcombe-Wilson Score CI存在过保守的问题,本研究新提出的Cornish-Fisherhybrid CI平均置信区间宽度小于Newcombe-Wilson Score CI,同时新方法的平均置信区间覆盖率更优,更接近置信水准1-α,故推荐使用新方法。结论:当事件发生率小于20%或大于80%时,本研究提出的置信区间估计新方法较常用的估计置信区间的Wilson Score CI方法有更优的统计性能。