论文部分内容阅读
[背景]随着社会经济和医学模式的转变,在癌症患者的临床决策中越来越注重生命质量(QOL)这一个以患者为中心的指标对疗效评价的意义以及对疾病结局的影响,因而癌症患者生命质量的研究也备受关注,成为医学领域生命质量研究的主流。生命质量测评的前提和关键是要有一个合适的工具——生命质量测定量表,国内外学者在相关领域都开展了研究工作,并开发了多种量表。但在目前的量表开发中:(1)大部分都为散在开发,缺乏系统性和连贯性:(2)由于生命质量的文化依赖性,国外学者研制的量表无法真正体现中国文化背景和价值体系下研究对象的主观体验。因此,很有必要开发基于中国文化背景的生命质量测定量表。(3)大部分量表开发的方法学基础都是基于经典测量理论,其采用的计算公式简单明了,浅显易懂,易于实施,但存在一些难以克服的局限性:①统计量的样本依赖性,抽样变动大;②能力与难度量表的不一致性,难以匹配;③测验分数的测验依赖性,分数难比较;④平行样假设难以实现。为了弥补经典测量理论的局限性,使量表的开发更具科学性,有必要融入现代测量理论。本课题组在前期的工作中采用共性模块与特异模块结合的方式系统开发了癌症患者生命质量测定量表体系(Quality of Life Instruments for Cancer Patients)第一版本QLICP (V1.0),并完成了六种癌症(肺癌、头颈癌、乳腺癌、胃癌、大肠癌、宫颈癌)量表的研制。这些量表在应用中发现一些问题,如结构有待细化调整,个别条目需要修改或补充等,因此有必要进一步修改完善形成新的版本。此外,还有很多癌症适宜进行生命质量评价(如肝癌、卵巢癌、白血病等),也需要研制这些疾病的特异量表,以形成较全面的QLICP体系。另外,虽然课题组在量表体系的开发工作中已经应用了一些现代统计技术如结构方程模型,但整个开发工作主要还是建立在经典的测量理论CTT上。鉴于CTT存在的明显缺陷,已经发展出了项目反应理论和概化理论两种现代测量理论并在教育与心理测量中得到了广泛的应用。为了及时吸纳和应用现代测量理论,需要在这些测量理论的指导下开发新的量表体系。此外,在量表的研究中目前还有一个热点和难点就是得分的合理解释,它是量表推广应用的关键。最小临床重要差异(Minimal Clinical Important Difference, MCID)就是在此背景下产生的。MCID也称最小临床重要性变化MCIC(minimal clinically important changes)、临床有意义变化CMC(clinically meaningful changes)或临床显著性变化CSC (clinically significant changes),指生命质量得分要改变多少才具有临床意义。MCID的制定可以让研究者或医生更容易判断研究结果的意义和干预措施的效果,完善疗效的评价体系。研制出特定QOL量表的MCID,不仅便于推广QOL应用,也可为临床上大量使用的量表制定MCID提供方法依据。鉴于此,在国家自然科学基金等的资助下,本课题组已经开始了在经典测量理论和现代测量理论指导下第二版本QLICP (V2.0)的研制工作,其中共性模块(QLICP-GM)是非常重要的核心量表,本研究拟探讨其研制与评价,以及该量表MCID的制定。[目的]1.尝试用项目反应理论(IRT)和概化理论(GT)两种现代测量理论方法并结合经典测量理论CTT来指导研制癌症患者生命质量测定量表体系共性模块第二版QLICP-GM (V2.0),为研制整个量表体系奠定坚实基础。2.现代测量理论与经典测量理论结合对QLICP-GM (V2.0)进行综合的测量学特性评价。通过现场实际测定,对量表的测量学特性(信度、效度和反应度等)进行评价。3.对现代测量理论与经典测量理论在量表研究中的应用结果进行对比分析,为研究开发其它量表提供更加科学的方法学依据,也为现代测量理论在生命质量量表研究中的推广与应用提供方法学借鉴。4.对研制的量表QLICP-GM结合其它资料探讨QOL得分变化的临床意义,制定出此癌症量表的MCID。[方法]1.研究对象随机抽取调查期间(2009年-2014年)选定的调查医院确诊的6种癌症(膀胱癌、脑癌、食管癌、白血病、肝癌、鼻咽癌)住院患者为调查对象。纳入标准:(1)临床上已确诊的上述6种癌症住院患者;(2)具有小学及小学以上文化程;(3)自愿参加测评。排除标准:(1)文盲;(2)神智不清楚、无法清楚表达自己内心感受者;(3)危重病人。2.研制与考评量表的研制主要包括以下六个步骤:确立量表研制的工作小组、生命质量的概念分解与形成理论框架、共性模块条目的形成、预调查及条目再筛选、正式调查及量表考评、修改完善与推广应用。调查时,调查者以医生的身份出现,对量表进行简单的解释和说明后发给患者填写,等其完成后收回量表并检查有无漏项。为了评价反应度,要求调查对象分别在入院的第一天和出院当天各填写一份调查表;为了评价重测信度,抽取一定数量的患者在入院的第二天进行重测;调查时同时增加了EORTC生命质量测定量表体系中的共性模块QLQ-C30(V3.0)作为研究量表的校标。量表的考评主要通过实际测定后的数据对量表的测量学特性(信度、效度、反应度)和可行性来进行分析。之前需要根据量表结构计算各领域、侧面及总量表得分,逆向条目要进行正向变换,原始分通过极差化法转换为取值在0~100的标准分。3.项目反应理论(IRT) 项目反应理论通过项目特征函数(item characteristic function, ICF)和项目反应曲线(item chataceristic curve, ICC)来刻画项目与特质的关系,并通过信息函数反映测量误差(信度)。根据癌症患者测评结果,并考虑到量表条目均为有序多分类形式的特点,采用项目反应理论中等级多分类资料的塞姆吉玛(Semejima)等级反应模型(其基本模型为Logistic双参数模型)建立每个条目的特征曲线,以信息函数大小并结合各条目区分度、难度等特征进行条目筛选。4.概化理论(GT) 采用随机单面交叉设计分析各个领域QOL得分的影响因素(侧面)并指导项目数的确定和项目筛选。概化理论分两步走,先进行G研究,然后在G研究基础上进行D研究。G研究称为概化研究(Generalizability Study),是依据观测全域对所有侧面(量表条目,记为i)和测量目标(患者QOL水平,记为P)以及它们之间的交互作用作方差分量估计的过程。D研究称为决策研究(Decision Study),是在G研究基础上,对各测量侧面、测量目标以及它们之间的交互作用关系做出方差分量的再估计及推断性研究的过程。D研究相当于经典测量理论中对信度的测量评价,但是其指标是概化系数(Eρ2)和可靠性指数(φ)。5.量表得分的MCID制定采用以锚(效标)为基础的方法和以分布为基础的方法结合制定MCID。以锚为基础的方法中,选择的锚(效标)是EORCT生命质量测定量表QLQ-C30中的第29这个条目“您如何评价在过去一星期内您总的健康状况”以及第30个条目“您如何评价在过去一星期内您总的生命质量?其选项均为7个等级,筛选出参加治疗前后调查的患者中该条目的选项两次相差一个等级和至少相差一个等级者,计算这些患者各领域的生命质量标准得分均数的差值,以此为各领域的最小重要差异分MCID。若差值为正态分布资料,则计算差值的均数,该均数即为最小差异,若为偏态分布,则以中位数为最小差异。以分布为基础的方法主要是通过计算效应大小(ES)及标准测量误差(SEM)来进行分析。本研究中采用ES=0.5时的变化分数为最小重要差异值。6.统计学软件用数据库软件Excel、Foxpro进行数据的录入管理,采用统计分析软件SPSS15.0、AMOS19.0、MULTILOG7.0等对资料进行统计分析。[结果]1.条目筛选预调查得到癌症患者总人数为190人,采用相关系数法、变异度法、因子分析法、Cronbachα及IRT对QLICP-GM测试版41个条目的预测试数据分析来筛选条目,根据事先确定的删除标准一一选择条目,规定三种及以上方法均入选者为“统计入选”并进入下一步的专家定性分析。在统计学定量分析的基础上,通过两场核心小组讨论,最终修改形成了4个领域10个侧面32个条目的正式版本(删除8个条目,合并两个条目)。2.基于经典测量理论的量表考评结果正式测试时共调查6种癌症患者711例。(1)信度分析结果:除了共性症状与副作用领域外(0.66-0.71), GLICP-GM各个领域及侧面的重测相关系数及组内相关系数(ICC)均大于0.8,可以认为整个量表的重测信度较好;所有领域和侧面的克朗巴赫α系数均大于0.6,在领域层面,除了社会功能领域外其余都大于0.7,可以认为量表各领域的同质信度较好。(2)效度分析结果:①本量表的整个研制过程由各方面人员参与选题和讨论,所提出的条目涵盖了WHO提出的关于健康和生命质量的内涵及癌症病患者相对特异的问题,并按程式化的方式反复筛选、修改完善,所有病人对每个条目均容易理解和回答。因此可认为具有较好的内容效度。②条目与领域的相关性分析结果可知:躯体、心理、社会、共性症状与副作用等领域相关系数多数都较高,绝大多数条目与所属领域的相关性高于领域内条目和其它领域的相关性。总体来说,量表条目的维度相关性较好。结构方程模型的分析结果显示,QOLCD-GM的结构与设计时的构想基本符合,32个条目划分为四个领域、10个侧面,拟合尚可接受,但是还未达到拟合良好的状态。③采用EORTC QLQ-C30(V3.0)测定量表中文版作为效标,相关分析结果显示量表共性模块的效标效度较好。(3)反应度:各种癌症的反应度不尽相同。SRM的绝对值在0.2左右则反应度较低,0.5左右反应度适中,0.8及以上反应度较好。膀胱癌从共性模块总分到各领域都体现了适中到较好的反应度;脑癌则是在躯体功能领域和共性症状副作用领域反应度适中;肝癌主要是躯体功能领域和社会功能领域有适中及以上的反应度;鼻咽癌在社会功能领域及其人际交往和社会角色侧面表现出了适中的反应度;食管癌、白血病的反应度未达到理想状态。这可能和各种癌症患者的治疗方式有关。3.基于GT的测量学考评结果 G研究的结果显示:对于量表QLICP-GM(V2.0)的四个领域而言,变异的最大来源是患者与条目的交互作用(方差贡献率63.49%~69.99%),其次是患者效应(方差贡献率10.00%~26.22%),比重最小的均是条目效应(方差贡献率6.02%~22.97%);测量目的是患者的生命质量,患者效应和患者与条目的交互效应已经解释了得分总变异的80%以上,是比较合理的;社会功能领域条目的方差变异贡献率已经超过了20%,提示该领域的条目设计可能需要调整。D研究的结果显示:除社会领域外,其余领域的概化系数(Eρ2)和可靠性指数(φ)均大于0.7,与经典测量理论对信度分析的结果是一致的;随着各领域条目数的增加,绝对误差和相对误差逐渐减小,而概化系数和可靠性指数在逐渐增加,这为调整量表结构提供了科学依据。4.基于IRT的测量学考评结果 项目反应理论中的一个重要假设就是单维性假设(局部独立性假设),由于生命质量理论框架中已经明确包括生理、心理等多个维度,整个量表一起进行IRT分析不能不满足单维性,为此,分别按生理功能、心理功能、社会功能和共性症状与副作用四个领域进行IRT分析,基本满足单维性。参照相关文献,结合量表的结构本研究设定的条目信息量判定标准为:条目平均信息量>0.74的条目判定为优,<0.47的条目判定为差,0.47~0.74的条目判定为好。总的说来,各条目的区分度在合理范围,取值在1.08-1.43之间;除条目GS07外,每个条目的难度从1-4级呈单向递增,取值在-5.98-2.90间,等级程度的变化也没有出现逆反情况。躯体功能领域和共性症状与副作用领域的大部分条目能达到较好的信息量,但心理功能领域和社会功能领域条目的平均信息量都偏低。鉴于项目反应理论需要大样本才能得到比较稳定可靠的结果,需进一部增大样本量后考察信息量。尽管有些条目的平均信息量低,但在某些θ处信息量还是很高的,比如生理功能领域GPH6, GPH7在θ低于0时均比较高,说明这些条目还是有特定价值的。5.量表得分的MCID制定分别以QLQ-C30的Q29和Q30为主观锚,至少相差一个等级为标准,二者得到的各领域及总分的MCID是一致的,分别是9.38、8.33、6.25、7.14和7.03;以ES为中介指标得到的MCID分别是8.28、8.00、7.09、8.99和6.12;以SEM为中介指标得到的MCID分别是4.37、4.36、5.11、10.03和3.76。以效应大小(ES)为中介指标计算MCID与以锚为基础的方法计算MCID的结果相差不是很大,但以测量标准误(SEM)为中介指标时,计算的MCID值普遍小于以锚为基础的方法得到的MCID值。[结论]1.通过量表开发程序研制了QLICP-GM (V2.0),其经过测量学评价总体来说具有较好的信度、效度和反应度。2.项目反应理论与概化理论对量表测量学特性的评价结果与经典测量理论的结果基本一致。经典测量理论易于理解和操作,现代测量理论能提供更为科学和信息量更丰富的依据。三种理论结合使用,可以取长补短,更好地开发和评价量表。3.以效应大小(ES)为中介指标计算MCID与以锚为基础的方法计算MCID的结果较接近,建议使用Q29或Q30作为效标,以“至少相差1等级”为标准计算MCID。