用于量表项目功能差异分析的累积Logistic混合效应模型的研究和应用

来源 :中山大学 | 被引量 : 0次 | 上传用户:vonke
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究背景: 随着生存质量国际合作研究的不断拓展和深入,跨文化的量表研制越来越普遍。随之而来的问题是跨文化的量表是否具有测量等价性。面对相同生存质量的两个国家的人群,使用同一量表是否得出相同的结果,将是研究者关心的重要问题。量表的测量等价性评价,可以从两个方面进行考虑:"宏观"和“微观”。“宏观”指的是从整个量表的角度考察量表的等价性,方法已经较完善,例如结构方程模型等。“微观”指的是从条目的角度考察量表的等价性,即条目是否等价,其中研究最多的是项目功能差异(Differential Item Functioning,DIF)。 对于某个特定条目,如果来自于不同群体(组别),但能力(潜在特质)相同的被试者的反应值的概率分布不同,那么就称该条目存在DIF。在跨文化生存质量研究中,DIF可以定义为在不同的文化背景下具有相同生存质量(简称为“能力”)的不同群体对同一条目的反应概率不同。 目前已经存在大量DIF的检测方法,美国教育考试服务中心把这些方法分为四类:(1)期望条目分数法,包括STAND、SIBTEST、MULTISIB等等。(2)非参数优势比法,包括Mantel-Haenszel,Cochran-Mantel-Haenszel,Coxs β等等。(3)广义线型模型方法,即非线性混合效应模型方法,包括多层Logistic回归,Logistic混合模型,混合模型,多层广义线型模型等等。(4)基于IRT理论的方法(IRT-based methods):包括MIMIC,DFIT,RCML,TESTGRAF等等。 DIF方法在分析中存在以下的问题:①多数DIF方法容易受到单维性,局部独立性假设的影响。②IRT理论本身比较复杂,难于在大型统计软件(SAS,SPSS等等)上实现,只能依赖于其它软件包(Bilog,Multilog,ParscaIe,RUMM等等);加上计算机软件的局限性,多数IRT软件研究DIF时,只能容纳一个协变量,而不能容纳多个协变量。③生存质量量表有以下特征:多变量性、多维性特征;条目大多是有序多分类条目(Likert型条目);生存质量常常受到多个协变量(多个因素)的影响。由此可见,生存质量量表条目的DIF分析更加复杂。 非线性混合效应模型正好可以弥补上述多个缺点,①非线性混合效应模型明白易懂,能够容纳条目协变量、个体协变量、条目和个体的交互作用协变量,而且容易在SAS、SPSS等软件上实现。②非线性混合效应模型能够考虑生存质量量表的多变量性、有序多分类条目、多个分组变量。③非线性混合效应模型和IRT模型有很多相同之处,当生存质量参数服从某分布时,IRT模型其实就等同于非线性混合效应模型。Kamata等研究者认为:使用IRT模型和使用非线型混合效应模型进行拟合,其结果具有可比性。Williams等建立累积Logistic混合效应模型研究生存质量跟被试者对条目的反应之间的关系。 研究目的: 本研究的目的在于探讨用于跨文化生存质量研究中量表条目等价性的统计学方法:重点在于采用累积Logistic混合效应模型(非线性混合效应模型),探讨该模型是否可以分析与多个协变量有关的DIF。 研究方法: 本文采用既包括个体协变量、条目协变量,又包括条目和个体的交互作用协变量的累积Logistic混合效应模型。不包括条目协变量的模型称为交互作用模型,其中条目和个体的交互作用协变量的系数为DIF参数,用来检测DIF。 本文进行了模拟研究。交互作用模型分别按两纽个体生存质量的均值相同模拟了2条目模型,其中1个条目存在DIF(0.6):4条目模型,其中2个条目存在DIF(0.6)。每组均有500个个体,按照下面两种数据类型进行拟合:(1)二分类资料,(2)有序多分类资料。并且每种资料拟合两个模型。模型1:假定两组的生存质量参数一致,没有受到协变量的影响;模型2:假定两组的生存质量参数一致,但受到其它协变量的影响,比如性别、年龄等等。以上过程分别用SAS、Winbugs和RUMM拟合,重复模拟试验300次,使用DIF估计值的平均误差、绝对值平均误差、均方误差、假阳性率与假阴性率进行评价。对于二分类资料和有序多分类资料的模型1,产生数据时,设定不同的DIF参数值(0.2、0.4、0.6、0.8),分别用SAS和Winbugs对上述情况进行拟合。此外,我们将累积Logistic混合效应模型应用于中山大学肿瘤医院古模发教授提供的SF-36数据和世界卫生组织生存质量研究小组提供的WHOQOL—BREF数据。 结果: 通过对二分类资料和有序多分类资料(2个条目和4个条目)的模拟研究,都得到:①利用SAS和Winbugs估计累积Logistic混合效应模型的参数,非DIF条目和DIF条目的DIF估计值的平均误差、平均绝对差、均方误差均较小,两种方法进行拟合都较稳定。②随着性别变量的引入,模型2中,DIF估计值的平均误差、平均绝对差、均方误差跟模型1的一致,两个模型的拟合效果相同。③利用累积Logistic混合效应模型作DIF分析,DIF估计值的假阳性率和假阴性率一般均小于0.080,其功效高于利用RUMM作DIF分析的结果。④利用累积Logistic混合效应模型(模型1)作DIF分析,随着DIF参数值的增大(0.2、0.4、0.6、0.8),DIF估计值的假阳性率有减小的趋势,而假阴性率变化不大。 结论:本研究模拟结果表明:所采用的累积Logisic混合效应模型可以描述被试者对生存质量测定量表中条目的反应与其生存质量之间的关系。交互作用模型适合分析与多个协变量有关的DIF。 模拟结果显示:使用SAS的高斯积分近似方法估计累积Logisic混合效应模型可以获取有效并且准确的估计值。采用MCMC方法(Winbugs)估计参数,参数估计的精度跟SAS的一致,优于RUMM软件。可将SAS和Winbugs应用于累积Logistic混合效应模型,进行DIF分析。
其他文献
本文通过对吉林大学理学部各学院学生连续三年不及格率的跟踪分析,结合教学、管理等方面情况,探讨吉林大学理学部学生不及格率偏高的原因,并根据原因提出相应的对策建议,以达
针对齐大山、司家营两处鞍山式红铁矿品位低、嵌布粒度细和含有部分强磁性矿物等特点,我们开展了弱磁-强磁-醚胺反浮选新工艺的研究。反浮选时只用醚胺或用氢氧化钠和水玻璃
合理的考评体系是激发教师教学动力,帮助教师提高教学能力的有效手段.针对教师实验教学能力评价指标体系不尽完善的现状,根据基础医学验证性、综合性、设计性这三种不同类型
本文介绍了马甲瑙铁矿供水井内爆破增大涌水量的经验,爆前几乎为干孔,爆后水量达321m~3/d。 This paper introduces the experience of increasing water influx in blastin
从地质力学观点看,梅洛沃耶矿床的特点是不能用常规的方法预测其边坡变形和确定岩石的抗剪强度特性。这是由于在导致矿物骨架破坏的荷载的作用下围岩(天然含水量高的硬质和
学科建设是高校建设的核心,处在学校各项工作的龙头地位.以审核评估为契机,加强学科建设自我评估是强化高校内部质量保证体系、规范学科运行管理、促进学科竞争发展的重要途
林彪篡夺党和国家最高领导权的过程,也是他和“中央文革”以及他在军队内的同伙诬陷、迫害党政军领导人的过程。由于贺龙一度主持军委日常工作,成了林彪篡夺最高权力的障碍,
本科院校的必要学生在职业发展中经常性遇到就业质量的主观认知偏差,但实际就业环境和薪资待遇已经达到一定水平.为了进一步研究就业质量对学生心理预期的影响,已经相应的教
新时代来临,中职德育教育方式也紧跟潮流,从传统的教育模式转向现代化的教育,因此中职教育也就具有鲜明的时代性特征。对于中职德育教育而言,要不断地整合各方面的资源,促进
思想政治理论课有助于帮助高职院校大学生树立正确的“三观”,然而实践教学是理论教学不可缺少的重要组成部分,它丰富了理论教学内容,是对大学生进行思想政治教育的重要方法