论文部分内容阅读
研究背景WHO研究报告显示,全球60岁及以上老年人中约20%有不同程度的抑郁症状。预计到2020年,抑郁症将成为全球范围内发病率和死亡率居第二位的疾病。目前,我国老年人抑郁症患病率为13%-27%,并且患病率呈逐年不断升高的趋势。抑郁症严重降低老年人的生活质量,损害老年人健康,开展老年人抑郁症的研究是实现老年抑郁的早识别,实现“健康老龄化”的重要基础。但是,老年人的抑郁症症状容易与老年人疾病的自然结果以及痴呆等症状混淆不易被直接测量,因此必须借助测量工具。目前老年人抑郁测量工具使用最多的为GDS-15(15-item Geriatric Depression Scale,简版老年抑郁量表)和 PHQ-9(Patient Health Questionnaire-9,患者健康问卷抑郁量表),但目前尚未有证据证明任何一种特定的抑郁评估量表比其他量表更好。对于量表的评估,目前国内81.05%的量表使用经典测量理论(Classical Test Theory,CTT),仅有18.95%的量表评价应用了项目反应理论(Item response theory,IRT)。虽然CTT计算简便,理论方法较成熟,但IRT可以在条目水平上更细致地探讨调查对象的能力水平和作答反应的关系,克服CTT 一个测验只能提供一个统一的信度指标的缺点,可以使能力水平的误差最小。目前,我国使用的GDS-15和PHQ-9量表均是由国外翻译而来,考虑到量表引入过程中对量表的调整和验证可能会导致原始量表的不足以及量表研制存在的背景文化差异,因此有必要联合CTT和IRT对中文版GDS-15和PHQ-9在我国老年人抑郁评估中的使用效果进行评估,以期为量表在我国的进一步推广以及我国不同老年人群的抑郁评估工具的选择提供科学依据。研究目的1.联合IRT和CTT,对中文版GDS-15和PHQ-9量表应用于老年人抑郁评估的适用性进行分析。2.基于GDS-15和PHQ-9量表,对老年人抑郁的影响因素的分析结果进行分析。3.探讨量表各个条目在不同老年人群中进行抑郁测量的公平性。研究对象与方法本研究分别于2018年5月和2019年7月采用面对面访谈的形式对江苏泰兴市和宁夏石嘴山市的老年人进行横断面调查。研究对象纳入标准为60岁及以上;排除标准为耳聋、意识不清不能回答问题者;有认知缺陷、有严重心理障碍或精神疾病者;有严重的慢性疾病,如心力衰竭、呼吸衰竭、肝硬化、肾功能衰竭等以及体力活动极大受限或生活不能自理(吃饭、穿衣、上下床、上厕所、室内走动、洗澡6项指标中有两项及以上不能完成)。本研究中采用变异系数法、克朗巴赫系数法、相关系数法以及因子分析法对量表的信度及条目进行评价;采用验证性因子分析(Confirmatory Factor Analysis,CFA)以及区分效度等对量表的效度进行分析。根据量表条目之间的统计依存性,采用探索性因子分析进行量表的单维性假设检验,在满足假设性检验的基础上分别采用双参数Logistic模型(2PL)和等级反应模型(Grade Response Model,GRM)对GDS-15和PHQ-9量表进行参数估计。利用Rasch分析来评估模型的拟合程度,增加量表分析结果的说服力。采用非条件Logistic回归对老年人抑郁的影响因素进行分析,然后在上述Logistic回归的基础上,结合我国社会文化以及既往文献对选取变量进行项目功能差异性分析(Differential item functioning,DIF),对量表各个条目在不同人群中进行测量的公平性进行评估。本研究采用Epidata3.0进行数据的双录入;利用Spss24.0进行数据的统计学分析;采用Amos21.0软件进行验证性因子分析;采用MULTILOG7.03软件对量表进行项目反应理论分析;采用ConQuest2.0软件对量表进行Rasch分析;以P<0.05为差异有统计学意义。研究结果1.描述性分析结果本研究共回收量表2477份,量表合格份数为2472份,合格率为99.80%。其中江苏省泰兴市共1515份(男性730份,女性785份),宁夏石嘴山市957份(男性399份,女性558份)。受试者年龄为72.15±7.60岁。两量表均不存在地板效应和天花板效应。2.量表的信效度分析结果GDS-15和PHQ-9量表中克朗巴赫系数和分半信度均大于0.7,说明量表具有较好的内部一致性。条目评价结果显示:GDS-15量表中条目G2“您放弃了很多以往的活动和爱好”和G9“您宁愿在家,也不愿去做自己不太熟悉的事情”评价差,而PHQ-9量表中各条目均评价较好。PHQ-9和GDS-15量表Kappa值为0.416,两者评估结果高度一致。验证性因子分析结果显示:PHQ-9和GDS-15量表的χ2/df值分别为16.152和13.005,远高于适配标准。GDS-15量表中G2与G9条目标准化的路径系数均较低(0.19)。3.基于项目反应理论(IRT)的量表评价PHQ-9和GDS-15量表中因子比值分别为3.90和3.28(>3),均符合单维性假设。采用单维项目反应理论模型进行参数估计结果显示:PHQ-9和GDS-15量表的条目区分度和难度参数均在正常范围内,未出现难度的反向递增。PHQ-9量表在θ值为2处取得最大信息量为11.422,边际信度为0.741。GDS-15量表在θ值为1.4处取得最大信息量为6.147,边际信度为0.736,条目G9平均信息量最低(0.052)。虽然PHQ-9量表总的信息量高于GDS-15量表,但是GDS-15在较大范围内信息量较高,即对较大抑郁水平范围的老年人的测量准确性更高。4.量表Rasch分析结果怀特图分析结果显示:PHQ-9量表中被试者能力呈正态分布,但是条目难度为负偏态分布,患者的能力水平分布相对低于量表条目的难度水平。GDS-15量表中被试者能力和条目难度均呈正态分布,且条目拟合良好。条目的拟合统计指标分析显示:PHQ-9量表中条目P9“有不如死掉或用某种方式伤害自己的念头”难度最大为2.823且量表整体难度较大。GDS-15量表中难度分布较均匀。PHQ-9量表中各条目Infit MNSQ和Outfit MNSQ值均在可接受的取值范围内,模型拟合程度较好,各个条目均能较好的测量出老年人的抑郁强度。GDS-15量表中条目G11“您认为活到现在真是太好了”Outfit MNSQ值最低为0.09(<0.05),该条目对老年人抑郁强度测量效果较差。5.量表在不同人群中的公平性分析基于Logistic回归的老年人抑郁影响因素分析结果显示:基于PHQ-9量表评估的老年人受性别(OR=1.392,P<0.001)、民族(OR=3.324,P<0.001)、居住模式(OR=0.697,P<0.05)以及受教育水平(OR=0.586,P<0.001)的影响。基于GDS-15量表评估的老年人抑郁主要受性别(OR=1.521,P<0.001)、城乡分布(OR=1.590,P<0.001)、受教育水平(OR=0.753,P<0.05)、家庭月人均收入(OR=0.556,P<0.001)的影响。DIF分析结果显示:GDS-15量表中不同性别中各条目的DIF CONTRAST均处于正常范围(<0.5)。城乡分布中G2和G9条目DIF CONTRAST分别为-0.772和0.508,均大于0.5,即说明相同能力的城市和农村老年人在此条目上答题的概率不同,G2条目“您是否放弃了很多以往的活动和爱好”对农村老年人来说回答较难,G9条目“您宁愿在家也不愿去做自己不太熟悉的事情”对城市老年人来说难度较大。PHQ-9量表中性别和民族的DIF CONTRAST的绝对值均处于正常范围(<0.5)。研究结论1.PHQ-9量表适用于我国老年人的抑郁评价。但是对我国老年人来说普遍偏难,得分偏低。2.GDS-15量表中条目2和条目9存在结构效度较差,并且在城乡分布中存在偏性等问题,需要进一步调整后使用。3.抑郁评估工具的选取会影响老年人抑郁影响分析结果。4.与经典测量理论相比,项目反应理论更容易发现量表翻译过程中或者文化水平差异造成的量表中条目的不适用等问题。