临床试验配对二项资料两组率差和率比可信区间估计研究

被引量 : 2次 | 上传用户:gaobaobao127
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究背景临床研究中经常可以看到配对设计结果为二分类的数据。该类数据可以整理成一个配对四格表。针对四个格子中的频数进行数据分析时,视不同的研究目的有不同的方法学选择,常见的是根据两组率的差值和比值采用假设检验和可信区间方法对试验组和对照组进行优效性(Superiority)或非劣效性/等效性(Noninferiority/Equivalence)推断。近年来,有关配对二项资料的非劣效/等效性推断出现了众多的假设检验和可信区间估计方法,鉴于可信区间估计方法可以更直观、准确地进行临床判定,因此受到推崇。研究目的本研究通过考虑两组率的关联系数杂交两单组率的可信区间,构建两相关率差和率比的可信区间估计方法,采用Monte Carlo模拟方法对其统计性能进行比较研究,探讨不同方法的适用范围和应用要求,为临床试验配对二项资料的分析评价提供合理的统计方法学支持。方法1.两相关率差可信区间的构建。根据Zou和Donner提出的所谓再生方差估计(The Method of Variance of Estimates Recovery,MOVER)思想,选取单组率可信区间估计统计性能较好的Wilson方法、AC方法和Jeffreys方法,并考虑两组率的关联系数杂交构建出两相关率差的可信区间。在杂交过程中,选取8种不同的反映两相关率关联性的系数,与不同的单组率可信区间估计方法组合构成24种两相关率差可信区间估计方法。8种反映两相关率关联性的系数包括φ系数、Gamma系数、Kendall’s tau-c系数、Somers’D平均系数、Kappa系数、列联系数、夹角余弦系数和改进的夹角余弦系数。2.两相关率比可信区间的构建。根据MOVER的思想,结合Fieller理论,选取单组率可信区间估计统计性能较好的Wilson方法、AC方法和Jeffreys方法,并考虑两组率的关联系数杂交构建出两相关率比的可信区间。在杂交过程中,选取8种不同的反映两相关率关联性的系数,与3种不同的单组率可信区间估计方法组合构成24种两相关率比可信区间估计方法。8种反映两相关率关联性的系数包括φ系数、Gamma系数、Kendall’s tau-c系数、Somers’D平均系数、Kappa系数、列联系数、夹角余弦系数和改进的夹角余弦系数。3.模拟方法及参数设定。为了考量不同方法的统计性能,借助SAS9.2统计分析系统,采用Monte Carlo模拟方法进行各不同参数设定下的模拟实验。两相关率差可信区间模拟实验参数设置:(1)对照组总体阳性率π+1取三个不同水平,即[0.05,0.1],[0.4,0.6],[0.8,0.95]范围;(2)两相关率差值△取三种不同水平,即0,[0.01,0.05],[0.1,0.2]范围;(3)两组二元变量相关系数ρ取四种不同水平,即[-0.1,0],0,[0,0.2],[0.4,0.6]范围。选取样本量在n较小(10≤n≤20)和中等大小(30≤n≤50)两种情况。对于以上各种参数的不同组合,各随机产生1000个向量(n, π+1, Δ,ρ)。分别计算构建的各种可信区间的精确覆盖率、预期区间宽度、左尾未覆盖率、右尾未覆盖率,考察各种参数取值范围不同情况的组合下不同可信区间的统计性能。良好的统计性能应表现为区间覆盖率更接近事先定义的名义水平,区间宽度更窄,左右尾未覆盖区域对称性更好。两相关率比可信区间模拟实验参数设置:(1)对照组总体阳性率π+1取三个不同水平,即[0.05,0.1],[0.4,0.6],[0.8,0.95]范围;(2)两相关率比值θ取三种不同水平,即0.7,1,1.1;(3)两组二元变量相关系数ρ取四种不同水平,即0,0.2,0.5,0.9。选取样本量在n较小(10≤n≤20)和中等大小(30≤n≤50)两种情况。对于以上各种参数的不同组合,各随机产生1000个向量(n, π+1, Δ,ρ)。分别计算构建的各种可信区间的精确覆盖率、预期区间宽度、左尾未覆盖率、右尾未覆盖率,考察各种参数取值范围不同情况的组合下不同可信区间的统计性能。良好的统计性能应表现为区间覆盖率更接近事先定义的名义水平,区间宽度更窄,左右尾未覆盖区域对称性更好。结果率差95%可信区间估计:在所有模拟情况下,基于Wilson方法结合φ系数、Tau-c系数和Somer’D平均系数构建的可信区间方法覆盖率均非常接近事先给定的名义水平。其次是结合Gamma系数、Kappa系数、列联系数和改进的夹角余弦系数的可信区间,由这些系数构建的可信区间覆盖率在部分情况下低于名义水平。结合夹角余弦系数构建的3种可信区间覆盖率在很多情况下低于名义水平,统计性能最差。从基于的3种单样本率可信区间估计方法看,由Wilson和AC方法构建的可信区间覆盖率较好,由Jeffreys方法构建的可信区间覆盖率在很多情况下低于名义水平很多,性能最差。从构建的可信区间宽度看,在π+1靠近0.5时,基于Wilson方法构建的可信区间宽度最窄,其次是基于AC方法和Jeffreys方法构建的可信区间宽度;在π+1不靠近0.5时,基于Jeffreys方法构建的可信区间宽度最窄,其次是基于Wilson方法和AC方法构建的可信区间宽度。从双尾未覆盖率的对称性上未发现不同方法间明显的规律。率比95%可信区间估计:总体上,从结合的关联系数来看,结合Gamma系数、列联系数、夹角余弦系数和改进夹角余弦系数构建的两相关率比可信区间存在缺陷,由这些系数构建的可信区间覆盖率在许多情况下低于名义水平很多。从基于的3种单样本率可信区间方法上看,由Jeffreys方法构建的可信区间覆盖率相对最差,它在多数情况下低于名义水平,而且低于名义水平值很多。其次是基于AC方法构建的可信区间,在不少情况下也低于名义水平很多。相对来说,基于Wilson方法构建的可信区间覆盖率更接近事先定义的名义水平。从构建的区间宽度上看,不同的关联系数中结合夹角余弦系数和Gamma系数构建的可信区间宽度相对较窄,但由该系数构建的可信区间覆盖率不能很好的保证名义水平,所以该方法区间宽度较窄就失去了实际意义。结合其它系数构建的可信区间宽度表现相当。从基于的3种单样本率可信区间方法看,由Jeffreys方法构建的区间宽度相对最窄,其次是基于Wilson方法和AC方法构建的可信区间。从双尾未覆盖率的对称性上未见到不同方法间明显的规律。结论综合考虑,基于Wilson方法结合φ系数、Tau-c系数和Somers’D平均系数构建的可信区间方法估计的配对二项资料率差可信区间覆盖率能够较好的接近事先定义的名义水平,且在区间宽度上也有一定优势,具有较好的统计性能,因此是值得推荐的方法。在估计配对二项资料率比可信区间时,基于Wilson方法结合中系数、Tau-c系数、Somers’D平均系数和Kappa系数构建的率比可信区间覆盖率更接近名义水平,这几种方法是值得推荐的方法。
其他文献
本文将流通创新内涵分解为流通规模、流通效率、信息技术(信息化水平)、流通结构和流通渠道五个不同的维度,并基于2005-2017年全国层面、东中西三个不同地区的面板数据,就流
当前大学英语课堂中缺乏对中国传统文化的介绍,学生学习英语,却很难用英语却介绍本民族的文化,导致文化"失语"。针对这种现象,本文将试着提出解决措施。
实验目的:氯吡格雷(Clopidogrel)属于吩噻吡啶类抗血小板药物,在临床上被广泛应用于心脑血管疾病的治疗,但临床上发现患者对氯吡格雷的药物代谢存在显著的个体差异,研究表明CYP2C19
科学钻探是为地学研究目的而实施的钻探,是人类获取地球内部信息最有效、最直观的方法,它是通过科学探测地壳岩石圈、生物圈、水圈的组织结构、物质成分、形成机理等进行各类
《浮生六记》是一部水平极高影响颇大的自传体随笔,在清代笔记体文学中占有相当重要的位置。该书的特点在于真纯率真,独抒性灵,不拘格套,富有创造性。别具慧眼的陈寅恪指出:“吾国
三维可视化技术能够实现全景的空间展示,同时还可以关联模型对象和实物的相关参数和属性。本文深入研究三维可视化技术在输电线路规划设计中发挥的作用,希望能够促进电网建设
信息技术与学科课程整合是实现教育信息化的重要途径,近几年已成为教育研究领域的一个热点问题。目前高职学校教学中多媒体课件的使用是比较普遍的,但如何将信息技术与课程内容
中国房地产行业经过几十年的快速发展,现在已经不在是一般意义上的质量竞争,在产品特点、功能同质化日渐严重和消费者不断理性的多重压力下,房地产行业逐步迈进了品牌竞争时
水资源短缺,已经成为当今社会面临的最严重的问题之一。曲周县位于严重缺水的华北平原,水资源缺乏,而且地下水含盐量普遍偏高,水资源供需矛盾的日渐突出,严重制约了社会经济
目的本研究旨在利用描述性流行病学研究方法,调查某院2009-2011年三年医院感染数据,分析其医院感染患病情况、流行病学特征及其感染危险因素,为制定医院感染控制措施或政策提