论文部分内容阅读
研究背景:
随着生存质量国际合作研究的不断拓展和深入,跨文化的量表研制越来越普遍。随之而来的问题是跨文化的量表是否具有测量等价性。面对相同生存质量的两个国家的人群,使用同一量表是否得出相同的结果,将是研究者关心的重要问题。量表的测量等价性评价,可以从两个方面进行考虑:"宏观"和“微观”。“宏观”指的是从整个量表的角度考察量表的等价性,方法已经较完善,例如结构方程模型等。“微观”指的是从条目的角度考察量表的等价性,即条目是否等价,其中研究最多的是项目功能差异(Differential Item Functioning,DIF)。
对于某个特定条目,如果来自于不同群体(组别),但能力(潜在特质)相同的被试者的反应值的概率分布不同,那么就称该条目存在DIF。在跨文化生存质量研究中,DIF可以定义为在不同的文化背景下具有相同生存质量(简称为“能力”)的不同群体对同一条目的反应概率不同。
目前已经存在大量DIF的检测方法,美国教育考试服务中心把这些方法分为四类:(1)期望条目分数法,包括STAND、SIBTEST、MULTISIB等等。(2)非参数优势比法,包括Mantel-Haenszel,Cochran-Mantel-Haenszel,Coxs β等等。(3)广义线型模型方法,即非线性混合效应模型方法,包括多层Logistic回归,Logistic混合模型,混合模型,多层广义线型模型等等。(4)基于IRT理论的方法(IRT-based methods):包括MIMIC,DFIT,RCML,TESTGRAF等等。
DIF方法在分析中存在以下的问题:①多数DIF方法容易受到单维性,局部独立性假设的影响。②IRT理论本身比较复杂,难于在大型统计软件(SAS,SPSS等等)上实现,只能依赖于其它软件包(Bilog,Multilog,ParscaIe,RUMM等等);加上计算机软件的局限性,多数IRT软件研究DIF时,只能容纳一个协变量,而不能容纳多个协变量。③生存质量量表有以下特征:多变量性、多维性特征;条目大多是有序多分类条目(Likert型条目);生存质量常常受到多个协变量(多个因素)的影响。由此可见,生存质量量表条目的DIF分析更加复杂。
非线性混合效应模型正好可以弥补上述多个缺点,①非线性混合效应模型明白易懂,能够容纳条目协变量、个体协变量、条目和个体的交互作用协变量,而且容易在SAS、SPSS等软件上实现。②非线性混合效应模型能够考虑生存质量量表的多变量性、有序多分类条目、多个分组变量。③非线性混合效应模型和IRT模型有很多相同之处,当生存质量参数服从某分布时,IRT模型其实就等同于非线性混合效应模型。Kamata等研究者认为:使用IRT模型和使用非线型混合效应模型进行拟合,其结果具有可比性。Williams等建立累积Logistic混合效应模型研究生存质量跟被试者对条目的反应之间的关系。
研究目的:
本研究的目的在于探讨用于跨文化生存质量研究中量表条目等价性的统计学方法:重点在于采用累积Logistic混合效应模型(非线性混合效应模型),探讨该模型是否可以分析与多个协变量有关的DIF。
研究方法:
本文采用既包括个体协变量、条目协变量,又包括条目和个体的交互作用协变量的累积Logistic混合效应模型。不包括条目协变量的模型称为交互作用模型,其中条目和个体的交互作用协变量的系数为DIF参数,用来检测DIF。
本文进行了模拟研究。交互作用模型分别按两纽个体生存质量的均值相同模拟了2条目模型,其中1个条目存在DIF(0.6):4条目模型,其中2个条目存在DIF(0.6)。每组均有500个个体,按照下面两种数据类型进行拟合:(1)二分类资料,(2)有序多分类资料。并且每种资料拟合两个模型。模型1:假定两组的生存质量参数一致,没有受到协变量的影响;模型2:假定两组的生存质量参数一致,但受到其它协变量的影响,比如性别、年龄等等。以上过程分别用SAS、Winbugs和RUMM拟合,重复模拟试验300次,使用DIF估计值的平均误差、绝对值平均误差、均方误差、假阳性率与假阴性率进行评价。对于二分类资料和有序多分类资料的模型1,产生数据时,设定不同的DIF参数值(0.2、0.4、0.6、0.8),分别用SAS和Winbugs对上述情况进行拟合。此外,我们将累积Logistic混合效应模型应用于中山大学肿瘤医院古模发教授提供的SF-36数据和世界卫生组织生存质量研究小组提供的WHOQOL—BREF数据。
结果:
通过对二分类资料和有序多分类资料(2个条目和4个条目)的模拟研究,都得到:①利用SAS和Winbugs估计累积Logistic混合效应模型的参数,非DIF条目和DIF条目的DIF估计值的平均误差、平均绝对差、均方误差均较小,两种方法进行拟合都较稳定。②随着性别变量的引入,模型2中,DIF估计值的平均误差、平均绝对差、均方误差跟模型1的一致,两个模型的拟合效果相同。③利用累积Logistic混合效应模型作DIF分析,DIF估计值的假阳性率和假阴性率一般均小于0.080,其功效高于利用RUMM作DIF分析的结果。④利用累积Logistic混合效应模型(模型1)作DIF分析,随着DIF参数值的增大(0.2、0.4、0.6、0.8),DIF估计值的假阳性率有减小的趋势,而假阴性率变化不大。
结论:本研究模拟结果表明:所采用的累积Logisic混合效应模型可以描述被试者对生存质量测定量表中条目的反应与其生存质量之间的关系。交互作用模型适合分析与多个协变量有关的DIF。
模拟结果显示:使用SAS的高斯积分近似方法估计累积Logisic混合效应模型可以获取有效并且准确的估计值。采用MCMC方法(Winbugs)估计参数,参数估计的精度跟SAS的一致,优于RUMM软件。可将SAS和Winbugs应用于累积Logistic混合效应模型,进行DIF分析。