一种新的单样本率的置信区间估计方法

来源 :南方医科大学 | 被引量 : 0次 | 上传用户:FlamesTsui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
背景:在医学研究领域,以二分类数据为结局的资料类型十分常见。对于此类数据的分析,应用中通常会给出效应量及效应量的置信区间,其中最常用的效应量包括:率、率差、率比、优势比等。单样本率的置信区间估计方法较多,以Wilson Score法的应用最为广泛,但均存在极端率情形下(接近0%或100%)置信区间覆盖率急剧下降的情况,即“downward spikes”现象。此外,不同方法还有着自身的局限,如Agresti-Coull提出的对于样本成功例数和失败例数分别加2的Agresti and Coull add 4 CI以及于样本成功例数和失败例数分别加z2的Agresti and Coull add z2 CI,Guan提出的广义Score法(Generalized Score CI),以及Yu提出的基于中点校正的Score法(Improved Score interval with a Modified Midpoint)等,虽然从不同的方面对Wilson Score CI有所改善,但是仍存在覆盖率不稳定、区间宽度过大等问题。在精确法中,Clopper-Pearson CI可以保证区间覆盖率不低于所设定的检验水准,但是该方法过于保守,Mid-P CI相对于Clopper-Pearson CI有所改善,但是结果仍较保守,而且精确法的计算量大,在应用上受到了一定的限制;Rubin和Schenke基于贝叶斯理论提出了Jeffrey CI,该方法能够解决在极端率的情况下区间覆盖率急剧下降的问题,但是其区间估计的结果过于保守,而且当事件发生率不接近0或者1时同样会出现“downwardspikes”现象。因此,目前并没有一种公认较好的单样本率的置信区间估计方法。两独立样本率差置信区间的构建相对于单样本率的情况更加复杂,虽然当前已有数十种方法被提出,但是这些方法自身均存在一定的不足。目前最常用的是Newcombe与1998年提出的Newcombe-Wilson Score CI,这种方法也受到了美国临床实验室标准化协会以及FDA指南的推荐。但是,当率接近0或100%的时候,Newcombe-Wilson Score CI较为保守。目的:本研究旨在基于Cornish-Fisher展开式结合Score法思想提出一种新的单样本率置信区间构建方法,并进一步将新方法推广到两独立样本率差置信区间的构建中,以期较现有方法的统计性能有明显改善。方法:(1)新方法的提出Comish-Fisher展开式是一种用于估计概率分布分位数的渐近展开方法,由Cornish和Fisher两位著名统计学家于1960年提出。其主要思想是通过概率分布的前n阶累积量和标准正态分布的分位数来近似估计概率分布的分位数。Wilson Score CI在极端率的条件下可能会出现覆盖率急剧下降的问题,其主要原因是当事件发生率接近0或1时,二项分布并非近似服从正态分布。因此,本研究考虑提出一种新的置信区间构建思想,在构建单样本率的置信区间时,舍弃传统的正态近似法,直接采用Cornish-Fisher展开式估计二项分布的分位数,希望以此避免近似正态分布时产生误差,提高结果的精确性。本研究将基于这种新思想构建的单样本率的置信区间命名为Cornish-Fisher CI。MOVER法(Method of Variance Estimate Recovery)是一种常用的率差/率比置信区间的构建策略,其主要思想是通过方差重估计(Variance Estimate Recovery)的方法将单样本率的置信区间“杂交”成两样本率差/率比的置信区间。我们将本研究提出的置信区间构建思想结合MOVER法构建出一种新的两独立样本率差的置信区间,并命名为Cornish-Fisher hybrid CI。(2)模拟研究在比较各种置信区间估计方法的优劣时,采用的评价指标包括置信区间的区间覆盖率、置信区间宽度、尾侧不覆盖率及其比值、最小区间覆盖率、均方误、平均置信区间宽度以及方法的计算复杂程度。对于单样本率的置信区间估计,本研究共纳入8种常见的方法包括:Wilson Score CI、Wald CI、Modified Midpoint CI、Generalized Score Cl、Agresti-Coull add z2 CI、Jeffrey CI、Mid-P CI、Randomized Plausible Interval,与新方法Cornish-Fisher CI进行模拟比较。对于两独立样本率差的置信区间估计,本研究重点考察当前使用最广泛的方法Newcombe-Wilson Score CI与新方法Cornish-Fisher hybrid CI 的优劣。结果:对于单样本率的置信区间估计,本研究提出的新方法在平均置信区间覆盖率、均方误及平均置信区间宽度等方面均表现最优,即在纳入比较的几种方法中,新方法在保证平均置信区间覆盖率的情况下,它的均方误及平均置信区间宽度是最小的。对于两独立样本率差的置信区间估计,当两事件发生率π1和π2接近0或1,即在(0,0.2](?)[0.8,1)范围内时,当前广泛推荐使用的Newcombe-Wilson Score CI存在过保守的问题,本研究新提出的Cornish-Fisherhybrid CI平均置信区间宽度小于Newcombe-Wilson Score CI,同时新方法的平均置信区间覆盖率更优,更接近置信水准1-α,故推荐使用新方法。结论:当事件发生率小于20%或大于80%时,本研究提出的置信区间估计新方法较常用的估计置信区间的Wilson Score CI方法有更优的统计性能。
其他文献
EHB是一种线控制动(brake-by-wire)系统,它以电子元件替代了部分机械元件。制动踏板不再与制动轮缸直接相连。
幼儿园中家园合作教育的开展,是关系幼儿健康成长的重要项目,家庭是孩子接受教育的起点,每个幼儿的全方面发展都离不开校方和家庭的共同努力。但在当前的家园合作教育工作中,
五四时期,在中国传统文化和近代启蒙思潮的双重滋养下,青年毛泽东的自我观是徜徉于传统与现代之间的。他推崇个人的崛起,但始终不曾放下自我的公共担当;他理想的自我虽不同于传统
高位收水冷却塔具有明显节能优势,目前在我国百万机组火力发电市场中具有广阔的应用前景。集水槽是高位收水冷却塔回收冷却水的集水池,其结构设计的安全可靠对火力发电厂安全运
目的:研究影响小儿静脉留置针保留时间的因素。方法:选择本院和成都市第五人民医院儿科2007年8月~2010年8月收治的患儿,所有患儿住院时间超过7d,需要静脉输液治疗患儿中使用留置
脑卒中是城区居民常见的脑血管疾病,我国的发病率和死亡率都较高,均居世界前列。我国每年约有150万人发生脑卒中,其中100万人死亡,给家庭、社会和国家带来沉重的负担。本研究对杭
为了满足中国散裂中子源谱仪对大型中子探测器的需求,基于已有的基础,开始了一套有效面积为650 mm×650 mm的多丝室样机的研制,主要研究大面积的MWPC探测器核心部分的制作、
基于系统散热以风扇为主的情形,本文分析了现有技术设计缺陷,并提出了由端口获取模块(接收单元、查询获取单元)、功耗获取模块、转速获取模块、关系获取模块组成的模块化散热
《白雪遗音》是清朝华广生收集编纂的一部民歌集子。近读上海古籍出版社《明清民歌时调集》收录的《白雪遗音》时,发现其中某些《马头调》曲子有疏漏,主要有三方面:句读的错
毛泽东的人学思想经历了青年时期、成熟时期以及晚年时期三个阶段的发展.中国传统哲学、西方哲学以及马克思主义哲学作为三种异质的文化资源,在毛泽东人学思想的不同发展时期