基于Bland-Altman法LoA可信区间的一致性评价

被引量 : 14次 | 上传用户:talent_luo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究背景和目的医药卫生领域经常涉及定量方法比较研究,其中最常见的情形是以现行方法为参照,将待考评的新方法与之进行比较,通过两种方法测量结果的一致性评价,以回答两者是否具有可互换性。Altman和Bland于1983年指出定量方法研究一致性评价采用直线相关分析、回归分析和配对t检验的不合理性,提出一种简单的用两种方法结果差值对其均数绘图的图示方法。1986年Bland和Altamn进一步对方法进行扩展,完善了原来的图示方法,建立了均差加95%一致限并配合图示的一致性评价方法,该方法后来被人们称为Bland-Altman方法,两位学者之后接着对该方法进一步扩展。Bland-Altman方法因其直观,分析和解释简单在医药卫生领域得到迅速推广,甚至作为一种“金标准”方法。但是,无论是差值均数,还是差值的95%LoA都只是样本统计量,不可直接用于对总体的统计推断,因此,应通过其可信区间的估计结果才可推断总体一致性与否。尽管在Bland和Altman的几篇统计方法学论文中有所涉及,Hamilton等学者也指出对LoA估计可信区间的必要性,Stockl等更是建议要在Bland-Altman图中增添可信区间和误差限的图示,非常遗憾的是实际进行一致性评价往往只给出差值均数和95%LoA,而并没有考虑可信区间的估计。同样,值得注意的是,以上所述系两种方法同时对个体进行一次测量的标准Bland-Altman方法,其应用有三个条件:一是差值的平均趋势在测量范围内保持不变;二是差值的散布程度在测量范围内保持一致;三是差值的分布呈正态分布。有学者把测量数据在这三方面的表现总称为数据行为,即若测量结果满足这三个条件,可认为数据行为良好,否则认为数据行为不良。对于方法比较研究数据行为不良的一致性评价,则不适合采用标准Bland-Altman方法。有关数据行为不良数据的一致性评价,Bland和Altman的系列文献中散在涉及。对于两种方法同时对个体进行多次测量的重复测量的一致性评价,近年研究和应用日渐增多。一般根据实际测量指标的特点,又分为真值不变的重复测量和真值变化的重复测量两种情形,其差值均数的计算、95%LoA及其95%可信区间的估计方法需要区别对待。实际中有些采用了重复测量设计的方法比较研究,并未按照重复测量机制应用Bland-Altman法进行一致性评价,甚至还存在方法学上的错误。随着一致性评价方法学研究的进步和用于定量测量的新产品(仪器、设备、试剂)开发的规范化监管需求,一些行政机构或专业组织就产品研发所需要的方法比较研究,专门出台了相应的指南,规定了一致性评价方法,如美国食品药品监督管理局设备与放射卫生中心2008年也曾针对体外诊断设备的一致性评价提出划分允许总误差/最大误差限区域的评价方法。但是,该方法的定性成分较多,并没有细节性地考虑定量测量的特性,导致结果的判定较为粗略。国内目前对采用Bland-Altman法评价一致性的方法学研究不多,多局限于基础性的方法介绍,且仅限于两种测量方法单次测量的情形,尚未见到有关重复测量设计的方法学研究,更没有见到系统的研究报道。尽管专业领域的应用逐年增多,但问题显而易见,急需我国的方法学研究者和应用者,无论从理论研究和实际应用都应给予高度关注。本研究将首先系统地介绍单次测量和重复测量两种设计情形Bland-Altman法一致限LoA的构造方法,并详细地介绍Bland-Altman法及MOVER法构造一致限LoA可信区间估计的方法,及通过Monte-Carlo模拟对其可信区间估计的统计学性能进行比较。然后,在验证LoA95%可信区间具有良好统计学性能的基础上,将其与FDA推荐的ATE/LER区域法进行达限率的模拟比较,以探讨其一致性评价性能的差异。最后,对两种设计情形的数据行为评价进行方法学提炼,并探讨单次测量设计数据行为不良时LoA的构造方法。研究方法基于SAS9.2系统,借助Monte Carlo模拟技术,对单次测量及重复测量两种设计情形下Bland-Altman LoA可信区间估计进行模拟及性能评估。在此基础上,再对Bland-Altman LoA可信区间与ATE/LER区域法进行性能评估的模拟,最后初步探讨数据行为的评价方法及数据不良情形Bland-Altman LoA的构造。具体过程如下:针对单次测量设计的情形,假定两种方法测量结果的差值服从标准正态分布,借助Monte-Carlo模拟,在不同的样本量下分别采用Bland-Altman法和MOVER法可信区间模拟估计1万次,获得95%LoA范围95%可信区间覆盖-1.96到1.96范围的覆盖率,用覆盖率与95%的接近程度评价不同方法的统计学性能,同时在临床认可一致性界值为-2.5到2.5范围的设定下判定用不同的可信区间方法达到一致的达限率加以佐证。随机模拟的样本量从10开始,间隔10递增,直到250为止针对重复测量设计的情形,区分所测量样本真值是否变化两种类型,借助Monte-Carlo模拟,在正态分布假定下,设定不同的样本量、不同的个体内变异性,分别采用Bland-Altman法和MOVER法可信区间估计,模拟获得95%LoA范围的95%可信区间对总体设定的覆盖率,用覆盖率与95%的接近程度评价不同方法的统计学性能。随机模拟的样本量从10开始,间隔10递增,直到250为止,不同样本量下各模拟1万次。在Bland-Altman LoA可信区间性能研究的基础上,针对单次测量的情形,对Bland-Altman LoA可信区间法与ATE/LER区域法进行统计学性能的模拟研究,在差值服从正态分布假定下,设定不同的样本量、不同的一致性界值及系统误差,模拟获得对总体设定的达限率来评价不同方法的统计学性能。随机模拟的样本量从50开始,间隔50递增,直到250为止;一致性界值从2.0开始,间隔0.25递增,直到3.0为止;系统误差从0开始,间隔0.5递增,直到1.0为止;不同组合下各模拟1万次。研究结果针对单次测量设计的情形,模拟结果显示,直接采用LoA法评价一致性因没有考虑抽样误差影响,理论上不严谨、实用时太宽松。用Bland-Altman法估计LoA可信区间覆盖率具有样本量依赖性,而MOVER法覆盖率独立于样本量、始终紧紧围绕事先设定的可信度95%微小波动。针对重复测量设计的情形,用Bland-Altman法估计LoA可信区间的覆盖率随样本量的增大而增大,样本量为20以下时覆盖率不足90%,即使在样本量达到250时,其覆盖率仍在94%以下,而MOVER法覆盖率始终紧紧围绕事先设定的可信度95%微小波动,甚至在样本量为10时覆盖率也能接近95%。两种定量测量方法单次测量情形下,Bland-Altman LoA可信区间法相比FDA推荐ATE/LER区域法的达限率,在没有引入系统误差时,在严格的一致性界值条件下,LoA的可信区间法较ATE/LER区域法的达限率要低一些,在宽松的条件下才慢慢趋于相近。在引入系统误差后,无论是在严格还是宽松的一致性界值条件下,LoA的可信区间法都要较ATE/LER区域法低很多。研究结论定量方法比较研究中,两种定量测量方法单次测量设计的情形,直接用LoA判定一致性并不合适,按照覆盖率评价其统计学性能太低,尽管进行可信区间估计的Bland-Altman法在性能上大大改善,但其覆盖率存在样本量的依赖性,而MOVER法的覆盖率独立于样本量,始终围绕给定的可信度上下微小波动。在满足Bland-Altman法一致限LoA一般应用条件时,采用MOVER法进行LoA可信区间估计具有很好的可靠性,是一种定量方法比较研究中理想的、值得推荐的一致性评价方法。重复测量设计的情形,若一致性的评价仍采用原来的Bland-Altman一致限LoA及其可信区间估计方法,而不考虑重复测量的特点一味按照各次测量是独立的来处理,将会影响结果的可靠性。尽管Bland和Altman给出了针对重复测量设计的LoA可信区间估计方法,但在小样本量时该方法达不到应有的统计学性能。而本研究介绍的重复测量设计LoA可信区间估计的新方法即MOVER法,在小样本量时仍然具有优良的统计学性能,值得推荐。单次测量设计情形,Bland-Altman LoA可信区间法与FDA推荐ATE/LER区域法的相比,在相同的临床可接受标准下,对一致性的判断更为严格。而ATE/LER法因其与临床检验领域的允许误差可变化的实际结合紧密,制定临床允许界值时具有更大的灵活性。实用中,可根据研究的具体情况和视不同宽严要求,适当选用不同的方法,或结合使用。定量方法比较研究的一致性评价,需重视数据行为的评估,若数据行为不良,可考虑对数据进行对数转换,或通过回归的方法构造水平V型的一致限。
其他文献
人类已经进入21世纪,已经由工业经济时代进入知识经济时代,在这样的时代背景下,摆在民营企业面前的唯一出路,就是按市场经济的法则规范自己的行为,按现代企业制度完善自己,用
<正>教师在进行数学知识的教学时,不仅要关注该知识内容的本质以及基本的教学策略,更要研究和了解学生在学习该知识内容的思维特点、学习困惑点、学习经验以及相应的教学策略
提取脑电节律往往是临床脑电图(EEG)诊断的关键一环。根据小波多分辨滤波器组的特点,从理论和数值实验两方面来讨论小波分解对信号频段的二进划分的特点,把一段采样频率为2kH
《国家基础教育课程改革指导纲要》的颁布和试点实验已经进入了第13个年头,课程改革要落实,课堂实践效果要更新,都离不开课程资源的开发和应用,课程资源的优劣程度影响着“教
目的:探讨高血压合并短暂性脑缺血发作的发病原理、临床特点及治疗。方法:收集高血压合并短暂性脑缺血发作(TIA)患者88例,进行24h动态血压检查和颈动脉彩色多普勒超声显像仪
目的探讨与老年多发性脑梗死发生相关的危险因素,为该病的防治提供客观依据。方法对2000年1月至2008年1月所收治的1416例脑梗死患者,根据临床观察确定老年多发性脑梗死的相关
<正>一、案例介绍家校联系是学校德育工作的重要组成部分,是促进学生全面发展的重要途径之一。恰当的家校联系会大大提高德育的效果,利于学生更好的发展,但不当的家校联系不
在榆林气田的地质研究中,首先提出了山2 段三分的小层划分方案,指出了山23 砂体稳定分布为气井获得高产的物质基础,并以此为主要目的层段分析了砂岩储层孔隙发育的控制因素,
目的分析肺母细胞瘤的组织发生与病理、临床表现、X线及CT表现,探讨提高对肺母细胞瘤的影像学诊断能力。方法经手术、病理证实的肺母细胞瘤3例,均行X线胸片、CT检查。结果肺
文章通过对茅盾《子夜》中女性形象的比较和分析,阐述了在20世纪30年代半封建半殖民地的中国社会,女性的存在只是男性社会的一个衬托、一个点缀、一个附属品,女性生存的实质