论文部分内容阅读
目的:
睡眠作为恢复精力和解除疲劳的主动过程,无论对个体还是人群而言都极为重要,若没有稳定适用的睡眠测量工具,则难以准确衡量评价睡眠状况,引进或开发睡眠测量工具在临床和社区中配置具有显著研究价值。(1)通过回顾跨文化有效性(Cross-Cultural Validity, CCV)引进国外测量工具的方法,总结全球睡眠测量主题领域主流工具,严格按照引进测量工具国际规范与标准流程操作引进睡眠品质问卷(Sleep Quality Questionnaire, SQQ),详细报道睡眠品质问卷中文版(Chinese SQQ, SQQ-C)语言文化等价性(Language & Culture Equivalence, LCE)建立过程。(2)睡眠品质问卷中文版用于测试中国人群,联合经典测量理论(Classical Test Theory, CTT)与项目反应理论(Item Response Theory, IRT),运用统计学模型全面深入分析睡眠品质问卷中文版各种测量学指标并系统评估使用性能。(3)评估测量等价性(Measurement Equivalence, ME)建立过程,为推广应用睡眠品质问卷中文版奠定坚实基础,同时为未来开发更符合中国国情的睡眠测量工具提供方法学借鉴。
方法:
按照引进测量工具科学规范流程,建立语言文化等价、测量中国人群、评价心理测量学属性和测量等价性。(1)测量工具准备:经过评估与选择确定睡眠品质问卷作为课题测量工具,获得睡眠品质问卷使用和翻译授权许可,遵循临床结局评估非营利组织(Mapi Research Trust, MRT)、国际药物经济学与结果研究协会(International Society for Pharmacoeconomics and Outcomes Research, ISPOR)和世界卫生组织(World Health Organization, WHO)等国际权威组织和机构的推荐指南进行语言验证和跨文化适应,建立SQQ和SQQ-C之间语言文化等价性。(2)数据来源与调查方法:调查时间从2019年5月至2020年3月,调查地点纸笔式取样(paper-and-pencil survey)分布在湖北武汉、十堰、襄阳,浙江宁波,内蒙古呼和浩特,云南昆明等城市以及网络在线式取样(online survey)分布在湖北、浙江等省市,抽样方式有分层抽样、方便抽样和雪球抽样3种。(3)数据处理与分析:①运用经典测量理论和模型进行项目分析后评估效度、测量等价性和信度等,效度指标包括结构效度、内容效度、效标效度等,测量等价性包括多群组测量等价性和纵向测量等价性,信度包括内在信度和外在信度等;其中,结构效度评价指标为因子分析模型(包括探索性因子分析、验证性因子分析、探索性结构方程模型等)考核指标,内容效度评价指标是内容效度指数(Content Validity Index, CVI),效标效度评价指标是测量工具与效标之间皮尔逊(Pearson)相关系数,测量等价性评价指标与验证性因子分析考核指标有关,内在信度评价指标有克隆巴赫系数(Cronbachsalpha,α)、盖特曼系数(Guttman’slambda-2,λ2和Guttman’slambda-6,λ6)、麦克唐纳系数(McDonald’somega,ω)、组合信度(Composite Reliability, CR)、平均方差抽取量(Average Variance Extracted, AVE)以及测量标准误(standard error of measurement)等,外在信度指标有重测皮尔逊(Pearson)相关系数和组内相关系数(Intraclass Correlation Coefficient, ICC)。涉及统计学模型主要为因子分析模型。②运用项目反应理论和模型评估项目拟合(item fit)、单维性/度(unidimensionality)、局部独立性(Local Dependence, LD)、项目功能差异(Differential Item Functioning, DIF)、分离度(separation)和可靠性(reliability)、分类概率曲线(category probability curves)、怀特图(wright map)等指标。项目拟合统计量评价指标有残差均方(MNSQ)和项目区分度指数(discrimination of index),单维性评价指标主要是未解释方差在第一特征根中比值(unexplained variance in 1st contrast),局部独立性通过项目之间残差相关评价,分离度分为被试分离指数(person separate index, PSI)和项目分离指数(item separate index, ISI),可靠性分为被试信度指数(person reliability index, PRI)和项目信度指数(item reliability index, IRI)。涉及统计学模型为等级量表模型。③通过t检验和方差分析比较中国人群睡眠品质。
结果:
(1)社会人口学:三类人群有效样本量合计14283人(total sample),共11个样本来源,其中,高校学生群体(包括研究生、本科生、专科生)共计9985人,医务人员共计2503人(包括正常情况下1915名和突发公共卫生事件即新冠肺炎疫情特殊背景下588名医务人员),患者群体(包括患者本人和患者亲友)共计1795人。将11个样本按照研究用途合并为5个:第一次测量高校学生样本(universitystudents,N1=9985)、第二次测量高校学生样本(universitystudents,N2=3540)、正常情况下医务人员样本(medicalworkers,N3=1915)、突发公共卫生事件即新冠肺炎疫情特殊背景下医务人员样本(medicalworkers,N4=588)、患者群体样本(patients,N5=1795)。第一次测量全部样本称之为全样本,按照研究用途合并的5个样本称之为分样本。
(2)经典测量理论:①结构效度:在五个分样本中进行平行分析确定SQQ-C因子结构,证实具有稳定二因子结构,除开第2项目(SQQ02)归属因子(分量表或维度)存在不同外,其余9个项目在因子归属上与SQQ日文版设计保持一致,SQQ日文版设计中第2项目归属于睡眠困难度(SDS, Factor 2)。在两次测量高校学生样本(N1和N2)中,第2项目归属于日间困睡度分量表(DSS, Factor 1),在正常情况下医务人员样本(N3)中,运用稳健极大似然法(RML)第2项目归属于日间困睡度分量表(DSS, Factor 1),而运用稳健加权最小二乘法(RDWLS)第2项目归属于睡眠困难度(SDS, Factor 2),在突发公共卫生事件即新冠肺炎疫情特殊背景下医务人员样本和患者群体样本(N4和N5)中,第2项目归属于睡眠困难度(SDS, Factor 2)。验证性因子分析和探索性结构模型将探讨三种情形下模型拟合情况,即第2项目归属于日间困睡度分量表(DSS, Factor 1)、第2项目归属于睡眠困难度(SDS, Factor 2)、删除第2项目。分样本一阶验证性因子分析显示稳健加权最小二乘法(WLSMV)相应模型拟合结果优于稳健极大似然法(RML);全样本验证性因子分析显示,同等情形下,睡眠品质问卷中文版双因子模型(bifactor model)拟合指标优于二因子模型(two-factor correlated model),二因子模型拟合指标优于单因子模型(one-factor model)。探索性结构方程模型分析显示,全样本双因子模型探索性因子分析拟合指标优于探索性分析;2次时间点探索性因子分析(运用探索性结构方程模型)支持睡眠品质问卷中文版具有稳定的因子结构,即多时点测量因子结构不变。②内容效度:S-CVI/Ave=0.922,I-CVI范围0.889~1.000(除开第2项目SQQ02的I-CVI=0.556外)。③效标效度:在分样本中SQQ-10与NRSS相关性范围为-0.732至-0.578,在合并样本中SQQ-10与NRSS相关性等于-0.658。在分样本中SQQ-10与SCI相关性范围为-0.636至-0.545,合并样本中SQQ-10与SCI相关性等于-0.546。SQQ-10与PSQI相关性等于0.561。SQQ-10与PSS-10相关等于0.517,在部分本中SQQ-10与GAD-2相关分别等于0.530、0.362,SQQ-10与PHQ-2相关分别等于0.524、0.375。SQQ-9和SQQ-10相比,同时效度呈现类似结果。④测量等价性:多群组验证性因子分析显示,睡眠品质问卷中文版二因子结构稳定,在全样本中具有跨人群和跨性别多群组测量等价性和在高校学生重测样本中具有纵向测量等价性。⑤内在信度:无论是全样本,还是分样本中,SQQ-C各种常用内在信度指标均大于0.70临界值,绝大多数指标大于0.80。SQQ-C分量表绝大多数各种常用内在信度指标均大于0.70临界值(由于SDS,Factor2项目数相对少,导致其Gutmannsλ6低于0.70)。此外,第一次测量全样本和第二次测量高校学生样本中,潜变量组合信度在均大于0.70,平均方差抽取量在大多数情况下大于0.50(即使小于,也接近0.50)。⑥外在信度:高校学生重测样本(N2)中,SQQ-C或分量表皮尔逊(Pearson )相关范围0.741~0.769,ICC值范围0.740~0.766,重测间隔时间8.975±5.600天。
(3)项目反应理论:①项目拟合:在全样本或分样本中,项目拟合统计量InfitMNSQ和OutfitMNSQ均在临界值范围(0.6–1.4)内,项目区分度指数均大于0.40(临界值),数据与Rasch模型拟合比较理想。②单维性:在全样本或分样本中,未解释方差在第一特征根中比值(1st contrast)取值范围1.8460~2.5017,支持睡眠品质问卷中文版具有单维性。③局部独立性:在全样本或分样本中,项目之间的残差相关性平均值取值范围-0.109~-0.106,均小于临界值(0.50或0.30)。④分离度和可靠性:PSI和PRI在患者群体样本中分别为1.85和0.77,在其他分样本和全样本中,PSI取值范围2.13~2.71,PRI取值范围0.82~0.88。ISI取值范围11.20~50.22,IRI取值范围0.99~1.00。⑤项目功能差异:全样本在性别中无项目具有项目功能差异;在人群中有项目SQQ02、SQQ03、SQQ04、SQQ09、SQQ10具有项目功能差异。⑥分类概率曲线:在全样本或分样本中,分类概率曲线未发现有无序阈值证据,SQQ-C功能运作良好,项目反应形式合适,项目难度与被试能力匹配。⑦怀特图:在全样本或分样本中,项目难度分布和被试能力分布基本一致,项目难度度量平均值和被试能力度量平均值差值均小于1.0(logits)。
(4)睡眠品质分析:不同性别人群睡眠品质比较,分样本中男性好于女性,但在突发公共卫生事件即新冠肺炎疫情特殊背景下医务人员样本中女性好于男性;医务人员在不同工作状态中睡眠品质比较,突发公共卫生事件即新冠肺炎疫情特殊背景下医务人员好于正常情况下医务人员;三类人群睡眠品质比较,医务人员好于患者群体,患者群体好于高校学生群体。
结论:
(1)睡眠品质问卷中文版具有优良的心理测量学属性:基于经典测量理论和项目反应理论分析,在三类人群(高校学生、医务人员、患者群体)测量中显示绝大多数测量学指标符合评价标准,甚至远优于评价标准。(2)睡眠品质问卷中文版二因子结构稳定和具有测量等价性:支持跨人群和跨性别多群组测量等价性,在高校学生重测样本中支持纵向测量等价性;在项目功能差异分析中,无项目在性别上有项目功能差异。(3)睡眠品质问卷中文版项目加总得分可以用于评价不同人群睡眠品质。简言之,睡眠品质问卷中文版具有跨文化有效性和国际合作可比性,建议在中文语言文化中配置使用。
睡眠作为恢复精力和解除疲劳的主动过程,无论对个体还是人群而言都极为重要,若没有稳定适用的睡眠测量工具,则难以准确衡量评价睡眠状况,引进或开发睡眠测量工具在临床和社区中配置具有显著研究价值。(1)通过回顾跨文化有效性(Cross-Cultural Validity, CCV)引进国外测量工具的方法,总结全球睡眠测量主题领域主流工具,严格按照引进测量工具国际规范与标准流程操作引进睡眠品质问卷(Sleep Quality Questionnaire, SQQ),详细报道睡眠品质问卷中文版(Chinese SQQ, SQQ-C)语言文化等价性(Language & Culture Equivalence, LCE)建立过程。(2)睡眠品质问卷中文版用于测试中国人群,联合经典测量理论(Classical Test Theory, CTT)与项目反应理论(Item Response Theory, IRT),运用统计学模型全面深入分析睡眠品质问卷中文版各种测量学指标并系统评估使用性能。(3)评估测量等价性(Measurement Equivalence, ME)建立过程,为推广应用睡眠品质问卷中文版奠定坚实基础,同时为未来开发更符合中国国情的睡眠测量工具提供方法学借鉴。
方法:
按照引进测量工具科学规范流程,建立语言文化等价、测量中国人群、评价心理测量学属性和测量等价性。(1)测量工具准备:经过评估与选择确定睡眠品质问卷作为课题测量工具,获得睡眠品质问卷使用和翻译授权许可,遵循临床结局评估非营利组织(Mapi Research Trust, MRT)、国际药物经济学与结果研究协会(International Society for Pharmacoeconomics and Outcomes Research, ISPOR)和世界卫生组织(World Health Organization, WHO)等国际权威组织和机构的推荐指南进行语言验证和跨文化适应,建立SQQ和SQQ-C之间语言文化等价性。(2)数据来源与调查方法:调查时间从2019年5月至2020年3月,调查地点纸笔式取样(paper-and-pencil survey)分布在湖北武汉、十堰、襄阳,浙江宁波,内蒙古呼和浩特,云南昆明等城市以及网络在线式取样(online survey)分布在湖北、浙江等省市,抽样方式有分层抽样、方便抽样和雪球抽样3种。(3)数据处理与分析:①运用经典测量理论和模型进行项目分析后评估效度、测量等价性和信度等,效度指标包括结构效度、内容效度、效标效度等,测量等价性包括多群组测量等价性和纵向测量等价性,信度包括内在信度和外在信度等;其中,结构效度评价指标为因子分析模型(包括探索性因子分析、验证性因子分析、探索性结构方程模型等)考核指标,内容效度评价指标是内容效度指数(Content Validity Index, CVI),效标效度评价指标是测量工具与效标之间皮尔逊(Pearson)相关系数,测量等价性评价指标与验证性因子分析考核指标有关,内在信度评价指标有克隆巴赫系数(Cronbachsalpha,α)、盖特曼系数(Guttman’slambda-2,λ2和Guttman’slambda-6,λ6)、麦克唐纳系数(McDonald’somega,ω)、组合信度(Composite Reliability, CR)、平均方差抽取量(Average Variance Extracted, AVE)以及测量标准误(standard error of measurement)等,外在信度指标有重测皮尔逊(Pearson)相关系数和组内相关系数(Intraclass Correlation Coefficient, ICC)。涉及统计学模型主要为因子分析模型。②运用项目反应理论和模型评估项目拟合(item fit)、单维性/度(unidimensionality)、局部独立性(Local Dependence, LD)、项目功能差异(Differential Item Functioning, DIF)、分离度(separation)和可靠性(reliability)、分类概率曲线(category probability curves)、怀特图(wright map)等指标。项目拟合统计量评价指标有残差均方(MNSQ)和项目区分度指数(discrimination of index),单维性评价指标主要是未解释方差在第一特征根中比值(unexplained variance in 1st contrast),局部独立性通过项目之间残差相关评价,分离度分为被试分离指数(person separate index, PSI)和项目分离指数(item separate index, ISI),可靠性分为被试信度指数(person reliability index, PRI)和项目信度指数(item reliability index, IRI)。涉及统计学模型为等级量表模型。③通过t检验和方差分析比较中国人群睡眠品质。
结果:
(1)社会人口学:三类人群有效样本量合计14283人(total sample),共11个样本来源,其中,高校学生群体(包括研究生、本科生、专科生)共计9985人,医务人员共计2503人(包括正常情况下1915名和突发公共卫生事件即新冠肺炎疫情特殊背景下588名医务人员),患者群体(包括患者本人和患者亲友)共计1795人。将11个样本按照研究用途合并为5个:第一次测量高校学生样本(universitystudents,N1=9985)、第二次测量高校学生样本(universitystudents,N2=3540)、正常情况下医务人员样本(medicalworkers,N3=1915)、突发公共卫生事件即新冠肺炎疫情特殊背景下医务人员样本(medicalworkers,N4=588)、患者群体样本(patients,N5=1795)。第一次测量全部样本称之为全样本,按照研究用途合并的5个样本称之为分样本。
(2)经典测量理论:①结构效度:在五个分样本中进行平行分析确定SQQ-C因子结构,证实具有稳定二因子结构,除开第2项目(SQQ02)归属因子(分量表或维度)存在不同外,其余9个项目在因子归属上与SQQ日文版设计保持一致,SQQ日文版设计中第2项目归属于睡眠困难度(SDS, Factor 2)。在两次测量高校学生样本(N1和N2)中,第2项目归属于日间困睡度分量表(DSS, Factor 1),在正常情况下医务人员样本(N3)中,运用稳健极大似然法(RML)第2项目归属于日间困睡度分量表(DSS, Factor 1),而运用稳健加权最小二乘法(RDWLS)第2项目归属于睡眠困难度(SDS, Factor 2),在突发公共卫生事件即新冠肺炎疫情特殊背景下医务人员样本和患者群体样本(N4和N5)中,第2项目归属于睡眠困难度(SDS, Factor 2)。验证性因子分析和探索性结构模型将探讨三种情形下模型拟合情况,即第2项目归属于日间困睡度分量表(DSS, Factor 1)、第2项目归属于睡眠困难度(SDS, Factor 2)、删除第2项目。分样本一阶验证性因子分析显示稳健加权最小二乘法(WLSMV)相应模型拟合结果优于稳健极大似然法(RML);全样本验证性因子分析显示,同等情形下,睡眠品质问卷中文版双因子模型(bifactor model)拟合指标优于二因子模型(two-factor correlated model),二因子模型拟合指标优于单因子模型(one-factor model)。探索性结构方程模型分析显示,全样本双因子模型探索性因子分析拟合指标优于探索性分析;2次时间点探索性因子分析(运用探索性结构方程模型)支持睡眠品质问卷中文版具有稳定的因子结构,即多时点测量因子结构不变。②内容效度:S-CVI/Ave=0.922,I-CVI范围0.889~1.000(除开第2项目SQQ02的I-CVI=0.556外)。③效标效度:在分样本中SQQ-10与NRSS相关性范围为-0.732至-0.578,在合并样本中SQQ-10与NRSS相关性等于-0.658。在分样本中SQQ-10与SCI相关性范围为-0.636至-0.545,合并样本中SQQ-10与SCI相关性等于-0.546。SQQ-10与PSQI相关性等于0.561。SQQ-10与PSS-10相关等于0.517,在部分本中SQQ-10与GAD-2相关分别等于0.530、0.362,SQQ-10与PHQ-2相关分别等于0.524、0.375。SQQ-9和SQQ-10相比,同时效度呈现类似结果。④测量等价性:多群组验证性因子分析显示,睡眠品质问卷中文版二因子结构稳定,在全样本中具有跨人群和跨性别多群组测量等价性和在高校学生重测样本中具有纵向测量等价性。⑤内在信度:无论是全样本,还是分样本中,SQQ-C各种常用内在信度指标均大于0.70临界值,绝大多数指标大于0.80。SQQ-C分量表绝大多数各种常用内在信度指标均大于0.70临界值(由于SDS,Factor2项目数相对少,导致其Gutmannsλ6低于0.70)。此外,第一次测量全样本和第二次测量高校学生样本中,潜变量组合信度在均大于0.70,平均方差抽取量在大多数情况下大于0.50(即使小于,也接近0.50)。⑥外在信度:高校学生重测样本(N2)中,SQQ-C或分量表皮尔逊(Pearson )相关范围0.741~0.769,ICC值范围0.740~0.766,重测间隔时间8.975±5.600天。
(3)项目反应理论:①项目拟合:在全样本或分样本中,项目拟合统计量InfitMNSQ和OutfitMNSQ均在临界值范围(0.6–1.4)内,项目区分度指数均大于0.40(临界值),数据与Rasch模型拟合比较理想。②单维性:在全样本或分样本中,未解释方差在第一特征根中比值(1st contrast)取值范围1.8460~2.5017,支持睡眠品质问卷中文版具有单维性。③局部独立性:在全样本或分样本中,项目之间的残差相关性平均值取值范围-0.109~-0.106,均小于临界值(0.50或0.30)。④分离度和可靠性:PSI和PRI在患者群体样本中分别为1.85和0.77,在其他分样本和全样本中,PSI取值范围2.13~2.71,PRI取值范围0.82~0.88。ISI取值范围11.20~50.22,IRI取值范围0.99~1.00。⑤项目功能差异:全样本在性别中无项目具有项目功能差异;在人群中有项目SQQ02、SQQ03、SQQ04、SQQ09、SQQ10具有项目功能差异。⑥分类概率曲线:在全样本或分样本中,分类概率曲线未发现有无序阈值证据,SQQ-C功能运作良好,项目反应形式合适,项目难度与被试能力匹配。⑦怀特图:在全样本或分样本中,项目难度分布和被试能力分布基本一致,项目难度度量平均值和被试能力度量平均值差值均小于1.0(logits)。
(4)睡眠品质分析:不同性别人群睡眠品质比较,分样本中男性好于女性,但在突发公共卫生事件即新冠肺炎疫情特殊背景下医务人员样本中女性好于男性;医务人员在不同工作状态中睡眠品质比较,突发公共卫生事件即新冠肺炎疫情特殊背景下医务人员好于正常情况下医务人员;三类人群睡眠品质比较,医务人员好于患者群体,患者群体好于高校学生群体。
结论:
(1)睡眠品质问卷中文版具有优良的心理测量学属性:基于经典测量理论和项目反应理论分析,在三类人群(高校学生、医务人员、患者群体)测量中显示绝大多数测量学指标符合评价标准,甚至远优于评价标准。(2)睡眠品质问卷中文版二因子结构稳定和具有测量等价性:支持跨人群和跨性别多群组测量等价性,在高校学生重测样本中支持纵向测量等价性;在项目功能差异分析中,无项目在性别上有项目功能差异。(3)睡眠品质问卷中文版项目加总得分可以用于评价不同人群睡眠品质。简言之,睡眠品质问卷中文版具有跨文化有效性和国际合作可比性,建议在中文语言文化中配置使用。