基于计算机自适应测试的胃痞患者报告结局量表研制

被引量 : 20次 | 上传用户:ppasu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的:在中医学和西医学理论指导下,基于经典测试理论和现代测试理论,遵照国际最新的量表研制理念和流程,建立基于计算机自适应测试的胃痞患者报告结局量表[Patient Reported Outcomes Instrument for Patients with Gastric Stuffiness Based on Computer Adaptive Test (GS-CAT)],并探索建立相关的患者报告结局量表研制方法学。方法:1.成立研究小组邀请多位相关研究领域的专家学者加入胃痞工作小组,包括概念框架小组、条目管理小组、数据管理小组、学术委员会、组外专家、学术顾问小组、数据协作小组共7个分支小组,各小组或工作单元由5-8人组成,全程在不同阶段组织和参与本研究。2.预设量表的基本特征预先初步规定量表的适用疾病、适用人群、工具类型、工具目的、条目数量、回答时间、反应尺度、计分规则、时间限制、管理方式等基本特征,保障研究方向的稳定性。3.预设研究的基本概念和术语预先初步制定患者报告结局、计算机自适应测试、条目反应理论、量表、胃痞和研究中需要的其他术语的内涵,保障研究的一致性。4.构建量表初步的理论框架依据项目研究中原理论框架模型(脾胃系疾病患者结局报告的计算机自适应试验信息网络体系,胃痛患者报告结局计算机自适应量表)的要求,回顾WHOQOL量表、美国Patient Reported Outcomes Measurement Information System (PROMIS(?))量表、中华生存质量量表、中医健康状况量表、中医脾胃系疾病患者报告结局量表和目前国际上普遍应用的普适性量表的概念框架结构,制定本研究对概念框架要求。然后,依据预制的胃痞患者采访问卷和专家采访问卷对至少5例胃痞患者和5名专家进行定性采访,并回顾相关量表和文献,制定量表初步的框架模型(版本b),交由下一步研究。5.条目库(item bank)的构建和条目初筛5.1检索收集条目由条目管理小组通过尽可能全面的方式检索与GS-CAT相关的条目,包括在各大数据库检索相关文献,回顾与胃痞相关的国家标准、行业标准和有较强公认影响力的描述,通过广州中医药大学第一附属医院住院部电子“海泰临床信息系统”回顾患胃痞者一线临床资料,搜索纳入所有相关条目形成GS-CAT条目清单。5.2建立条目库首先由数据管理小组制定条目的结构,包括条目主干、内容、回答设置、时间窗、工具来源、顺序号;然后,条目管理小组将GS-CAT所有条目清单纳入该数据库。5.3条目初筛5.3.1仓储法首先,由条目管理小组中的2名研究者从GS-CAT条目库中选择认为能代表各方面的条目,每一个条目可以被分配给首选方面,也可以同时分配给替代方面;然后,将结果交给第3名研究者进行核对,记录不一致的结果并交由小组全体讨论并最终取得一致意见。5.3.2精选法首先,由条目管理小组中的2名研究者从GS-CAT条目库中确定纳入或排除条目的属性特征;然后,将结果交给第3名研究者进行核对,记录不一致的结果并交由小组全体讨论并最终取得一致意见。5.4初步概念框架的修订随着条目的变化,量表初步的框架模型需要调整时,由概念框架小组进行修改。6.条目定性评阅6.1专家评阅条目由条目管理小组制定条目回答选项,并预先制定条目删除标准、条目修改标准、条目增加标准,概念框架修改标准、研究中止标准,首先由专家组内部依据上述标准逐一检查条目并修改,同时评估概念框架的合理性;然后,对修改结果进行小组讨论,取得一致意见后再邀请专家对工具的翻译能力进行评估,直到满足研究中止标准。6.2核心小组首先,拟定每个方面建立一个核心小组,每个核心小组包含6-12名参与者。条目管理小组对胃痞患者依据纳入和排除标准进行筛选,并确定讨论时间、地点、内容等。然后,组织召开核心小组讨论,要求患者完全基于自身感觉逐条审阅条目,并评估框架概念体系的合理性。条目管理小组评估信息饱和后中止研究。6.3认知采访首先,拟定每次采访至少5名参与者,每次采访讨论的条目在40条左右。条目管理小组对胃痞患者依据纳入和排除标准进行筛选,并确定讨论时间、地点、环境等。然后,进行认知采访,要求患者完全基于自身感觉逐条审阅条目,并评估框架概念体系的合理性。条目管理小组评估信息饱和后中止研究。6.4研究小组评估由项目组协调胃痞研究小组所有成员召开讨论会,评估量表条目和概念框架变化的特征,取得高度一致意见后进入下一步研究。7.标定研究测试采用描述性研究设计,依据预先规定的纳入和排除标准,采用胃痞患者社会学资料调查表和初步形成的胃痞患者报告结局量表(GS-CAT),于2011.9-2012.3期间针对胃痞患者进行现场调查和网络调查。现场调查地点为广州中医药大学第一附属医院脾胃病科住院部和门诊部,或患者认为合适的地点;网络调查无地点限制。8.模拟评价以IRT分析后确定的每个条目的参数为基础,选用Same jima等级反应模型进行蒙特卡洛模拟,获取量表更精确的参数。9.计算机自适应测试根据上述分析得出的参数估计,输入条目池和条目参数,进行数据探查和真值探查,确定起始点、计分运算规则和终止标准,发布GS-CAT量表测试版。10.统计方法10.1定性研究在本研究中,成立研究小组、量表的预设基本特征、基本概念和术语、工具初步的理论框架构建、条目库的构建和条目初筛、条目定性评阅共6个部分主要是对信息资料用定性化的内容进行讨论分析,各研究主体和研究对象的资料均用描述性分析。10.2标定研究测试10.2.1数据描述使用条目和量表的均数、方差、频数、极差、内部一致性系数、条目间的相关阵、条目-总分的相关阵、敏感性分析等指标对条目的性能和条目在工具中的运作方式进行分析。10.2.2IRT模型的假设前提评价和参数分析使用经典测试理论方法和证实性因子分析,观察条目间的相关阵、条目-工具的相关阵、内部一致性信度、比较拟合指数、近似误差均方根、标准化残差均方根、路易斯指数、因子载荷等指标对量表的单维度性进行评价;使用局部分离指数和定性分析对量表的局部独立性进行评价;使用局部加权回归散点平滑法对量表的单调性进行评价。然后,对各条目的条目特征曲线、条目信息曲线、一致性条目功能差异、非一致性条目功能差异等进行分析。10.3进行蒙特卡洛模拟评价,并构建量表计算机测试版本。结果:1.胃痞的概念追溯古文源流,对胃痞的病名、病位、性质、病/证/症属性等进行分析,本研究确定使用胃痞定义为:以自觉胃脘部(心和剑突下,脐以上)闷满胀塞,触按之无形柔软,压之不痛或微痛为主要表现的疾病。2. GS-CAT初步的概念框架2.1概念框架草稿的形成概念框架小组采用预制调查问卷,选择9名胃痞患者和5名专家进行定性采访,并回顾中华生存质量量表、中医健康状况量表、WHOQOL-BREF、胃痛PRO计算机自适应量表、中医脾胃系疾病PRO系列量表、QLICD-CG、基于慢性胃肠疾病患者报告临床结局测量量表、中医功能性胃肠病初量表、Functional Digestive Disorders Quality of Life Questionnaire (FDDQL)等量表的概念框架,结合疾病特点和中华文化特点,建立GS-CAT概念框架草稿,包括主要症状特征、伴随的消化症状和功能障碍、伴随的全身症状和功能障碍、影响因素、生理影响、心理影响、社会影响共7个方面19个层面。2.2概念框架的初步修订学术委员会首先审阅量表的框架结构并修改成7个方面17个层面,然后采用纸张和网络调查方式,收集9名专家意见,讨论后对概念框架再次修订,形成主要症状特征、伴随的消化系统症状和功能障碍、伴随的全身症状、影响因素、生理影响共5个方面12个层面。3.条目库的构建和条目初筛3.1检索收集条目条目管理小组回顾6个国内相关量表得到206个条目,回顾11个国外相关量表得到265个条目,回顾7个临床研究标准得到69个条目,回顾240例第一中医诊断为胃痞的患者临床资料得到247个条目,共收集到787条相关条目形成GS-CAT条目清单。3.2建立条目库数据管理小组提供GS-CAT条目清单的结构化变量,包括元序号、后序号、回忆时间、条目内容、条目主干、条目所属量表、条目所属领域、GS-CAT所属方面共8个,以EXCELL软件建立数据库。然后,条目管理小组对条目清单进行结构化处理,构建GS-CAT条目库。3.3概念框架调整和条目初筛3.3.1仓储法条目管理小组依据工作手册对GS-CAT条目库进行归类储存,2名研究者有48条分类不完全一致的记录,逐条讨论后形成一致的条目归属意见,最终组建包含479个条目的条目仓库(版本1Ⅰ),其中主要症状特征方面40个条目,伴随的消化症状和功能障碍方面208个条目,伴随的全身症状和功能障碍方面143个条目,影响因素方面41个条目,生理影响方面47个条目。3.3.2精选法条目管理小组依据工作手册对GS-CAT条目库进行精选,2名研究者有49条分类不完全一致的记录,逐条讨论后形成一致的条目精选意见,统一合并和删除324条,选择另外的155个条目;同时,增加12个条目,最终组建包含167个条目的GS-CAT条目仓库(版本Ⅲ),其中主要症状特征方面3个条目,伴随的消化症状和功能障碍方面59个条目,伴随的全身症状和功能障碍方面51个条目,影响因素方面29个条目,生理影响方面25个条目。4.条目定性评阅4.1专家评阅条目4.1.1回答选项条目管理小组首先制定条目回答选项,分为频度、程度、能力三个方面,同时制定卷首语。4.1.2专家调整概念框架专家组评估概念框架(版本b)的合理性,并对条目属性逐条分析,结合工具测量目的,将概念框架调整为消化系统症状和功能障碍、全身症状、生理影响共3个方面8个层面(版本c)。4.1.3专家修改条目首先,条目管理小组首先遵照概念框架(版本c)对条目进行初步评阅,修改7个条目,增加9个条目,形成包含176个条目的条目库,其中消化系统症状和功能障碍100个条目,全身症状51个条目,生理影响25个条目。然后,条目管理小组结合11名专家提供的123个条目修改意见再次对条目做出调整,修改82条,删除18条,增加10条;其后,邀请2名同时有双语背景和量表研究背景的研究者对工具的翻译能力进行评估,最终组建包含168个条目的GS-CAT条目库(版本Ⅳ),其中消化系统症状和功能障碍方面103个条目,全身症状方面44个条目,生理影响方面21个条目。4.2核心小组4.2.1首轮讨论建立包含24名患者的3个核心小组。遵循讨论意见,将消化系统症状和功能障碍和全身症状2个方面合并为症状方面;对18个条目的主干、内容、或回答选项进行修改,并删除41个条目,形成包含2个方面7个层面的GS-CAT新概念框架(版本d)和127个条目的GS-CAT条目库,其中症状方面109个条目,生理影响方面18个条目。4.2.2第二轮讨论建立包含16名患者的2个核心小组。遵循讨论意见,对所有条目进行自身结构合并,删除8个条目,增加10个条目,对所有重要信息进行加粗,最终组建包含129个条目的GS-CAT条目库(版本V),其中症状方面111个条目,生理影响方面18个条目。4.3认知采访依据预定计划,将条目库(版本V)分为4个部分,其中症状方面111个条目分为条目1-40、条目41-80、条目81-111共3个部分,生理影响方面18个条目为单独一个部分,每个部分选择5名胃痞患者进行采访。4.3.1首轮研究对20位患者进行采访。遵循采访意见,对62个条目进行修改,删除5个条目,增加5个条目。4.3.2第二轮研究对20位患者进行采访。遵循采访意见,对13个条目的回答选项进行调整,最终组建包含129个条目的GS-CAT条目库(版本Ⅵ),其中症状方面111个条目,生理影响方面18个条目。5.标定测试研究5.1患者的社会学资料和一般结果5.1.1一般特征在2011.9.1-2012.3.15期间,通过广州中医药大学第一附属医院脾胃病科住院部和门诊部患者现场调查,网络调查及其他方式进行数据收集。经整理,最终得到331条记录,年龄31.99±10.29岁;男性183例,女性146例;住院病人53例,门诊病人73例,网络调查60例,其他方式145例;汉族316例;城市/城镇患者291例。5.1.2疾病特征排除60例网络数据,对271例患者信息进行分析。其中257例胃痞为第一中医诊断;证素分析显示胃痞病位主要在脾(82.66%),与肝(46.49%)和胃(30.26%)关系十分密切;病性主要属气虚(76.75%),但气滞(33.21%)、热(22.51%)、湿(19.19%)、不和(9.23%)均密切参与胃痞病变;证素组合中4个证素组合为105例,3个证素组合为145例,2个证素组合为22例。5.1.3一般结果研究小组参照各患者和专家建议及小样本患者调查数据,同意初步采用调整的概念框架(版本e)进行分析,共包含“概念~组成部分~领域~方面~层面~条目”六级结构,含2个领域,5个方面,10个层面,129个条目。5.2初步概念框架的评价和调整5.2.1初步概念框架的评价量表总的克朗巴哈系数为0.963,但诱发因素层面(0.647)、胃痞生理影响领域(0.452)内部一致性较差,条目间的相关阵分析显示7组条目之间呈强相关,条目-总分的相关阵分析显示胃痞生理影响领域条目过多偏向胃痞症状领域,另有7个条目与本层面或方面的结构效度亦欠佳。因此,其初步概念框架与临床大样本的数据提供的信息不完全一致,尚需进一步调整。5.2.2初步概念框架的调整首先,使用离散趋势法、信度分析法、相关系数法、条目反应理论分析法共4种方法8个变量指标对条目进行筛选,若某条目同时满足2个删除指标则删除,最终删除37个条目,剩余92个条目(版本Ⅶ)进入下一步研究。然后,对概念框架进行探索性构建。使用探索性因子分析(KMO=0.901)提取23个主成分,判断各条目归属;使用系统聚类法(聚类数量限定为2-23个)也对各条目所属类别进行聚类;研究小组基于上述数据,结合条目内容和测量目标逐一讨论提取每个类别或因子特征,确定各条目归属,最终确定主症特点、胃肠不适、疲劳、头身和形色、内热表现、汗和寒热、七情及影响、大便、内因刺激诱发加重、外因刺激诱发加重、缓解因素共11个层面。结合各层面测量信息,逐个选择有临床价值的组合进行因子分析,最终确定以下4个方面:主症特点、胃肠不适、大便共3个层面组成消化症状方面(第一因子特征根值11.084,第二因子特征根值2.666,下同);疲劳、内热表现、汗和寒热、七情及影响共4个层面组成功能性紊乱方面(7.381,1.739);内因刺激诱发加重、外因刺激诱发加重、缓解因素共3个层面组成影响因素方面(6.678,2.507);头身和形色层面独立上属头身和形色方面(5.536,1.337)。然后,遵循同样的原则将上述4个方面进行合并。因子分析显示消化症状与功能性紊乱、消化症状与影响因素组合测量方向均一致;结合临床实际和条目内容,认为消化症状与影响因素组合均反映胃痞症状,故将其合并;功能性紊乱、头身和形色2个方面组合失败,均分别独立上属功能性紊乱领域和头身和形色领域。因此,通过条目筛选、因子分析、聚类分析和专家评议,研究小组采用自下而上的构建思路,基于临床数据对GS-CAT的条目和概念框架重新进行调整,组建起包含3个领域、4个方面、11个方面的概念框架(版本f)和92个条目的GS-CAT条目库进入下一步分析。5.3条目的描述性分析GS-CAT总量表的克朗巴哈系数为0.966,消化症状方面的克朗巴哈系数为0.937,影响因素方面为0.883,功能性紊乱方面和领域为0.903,头身和形色异常方面和领域为0.888,胃痞症状领域为0.949。量表中条目总的均数为1.979,极差为1.274,方差为0.079;整体量表的均数为182.062,方差为2077.584,标准差为45.581。5.4单维度性分析5.4.1经典测试理论的方法条目间的相关阵分析显示共5对条目之间的相关系数大于0.7,但均呈中相关;条目-工具的相关阵分析显示在各层面、方面和领域相同的等级层次之间,各条目与自身所在层面、方面和领域的相关系数均明显大于其他单元;内部一致性信度分析显示除外因刺激诱发加重(0.684)、内热表现(0.725)、汗和寒热情况(0.687)层面外,其他等级单元均具有良好的内部一致性信度。5.4.2证实性因子分析量表的近似误差均方根(RMSEA)=0.098(90%CI:0.082,0.11),模型拟合指数(CFI)=0.98,各层面与方面的因子载荷(factor loadings)分析显示消化症状方面为0.69-0.85,影响因素方面为0.54-0.87,功能性紊乱方面为0.61-0.79,头身和形色异常方面为0.79。5.5局部独立性分析分析显示消化症状方面的局部分离指数为0.961,影响因素方面为0.950,功能性紊乱方面为0.936,头身和形色异常方面为0.914;定性评价提示各结构有良好的局部独立性。5.6单调性分析局部加权回归散点平滑法分析显示量表、3个领域、4个方面、11个层面之间均有良好的单调性。5.7IRT模型参数分析对各条目的条目特征曲线(ICCs)和条目信息曲线(ⅡC)进行分析,结果显示大多数条目有良好的信息反映能力,如条目“I18GSS57在过去2周内,您有腹中坠胀的感觉吗?”的图形:但也有部分条目的工作能力欠佳,如条目“I26GSS70在过去2周内,您的大便颜色有改变吗,如变绿、褐色等?”的图形显示为:5.8条目功能差异分析首先,将定量的年龄资料转化为二分类资料[1=青年组(18-44岁),2=中老年组(≧45岁)],性别资料不变;然后,对各条目在不同年龄和性别的人群中进行条目功能差异分析。结果显示9个条目存在一致性条目功能差异(7个为不同年龄组间,2个为不同性别组间),如条目"I1GSS1在过去2周内,您有胃脘部(胸骨下、肚脐以上)不适的感觉吗?”在不同年龄组间的条目功能差异:5.9基于IRT参数分析的条目调整5.9.1条目调整IRT参数估计的ⅠCC和ⅡC曲线显示部分条目存在信息冗余,故对条目再次进行调整,将所有的条目回答选项由原来的1-5等级调整为1-3等级;删除2个方面中3个层面的11个工作能力较差的条目。5.9.2新条目的IRT参数估计对各方面的条目进行新一轮的参数评估,再删除1个层面中2个工作能力较差的条目。5.9.3概念框架调整由于内热表现层面和汗和寒热情况层面条目变化较大,结合条目自身测量内容和前期因子分析结果,将该两个方面合并为内热表现层面,其他各层面不变,形成包含3个领域4个方面10个层面的新概念框架(版本g)和79个条目的条目库(版本Ⅷ)。6.CAT测试程序6.1IRT参数估计对各条目的IRT参数再次进行分析,计算其区分度(a)和难度(b),评估其ICC特征,结果显示各条目有良好的区分度和难度系数。6.2Monteo-carlo模拟依据IRT分析产生的参数,使用Monte-carl o模拟3000名受试者,结果显示消化症状方面在theta=-0.20时条目库信息特征最大(32.005),标准误最小(0.1768);影响因素方面在theta=-0.20时条目库信息特征最大(32.005),标准误最小(0.1768);功能性紊乱方面在theta=-0.15时条目库信息特征最大(28.049),标准误最小(0.1888);头身和形色异常方面在theta=-0.15时条目库信息特征最大(17.836),标准误最小(0.2368)。6.3CAT测试程序构建首先,建立消化症状、影响因素、功能性紊乱、头身和形色异常共4个条目库,将各方面的条目纳入其中;同时,依据IRT参数评估中提供的a、b值对各条目参数特征进行界定。然后,选择最大化信息自适应测试类型,以θ值为[-1,1]为起始点,采用最大似然法估计参数,以当前θ值估计条目信息最大化为条目选择标准,以θ值小于等于0.3为终止标准,对条目进行界定管理,现场测试显示量表测评运行顺利。结论:基于计算机自适应测试的胃痞患者报告结局量表(GS-CAT)最终包含3个领域、4个方面、10个层面、79个条目。测量概念为胃痞的症状和体征,反应尺度为1-3级等级,主要载体为独立的电脑或互联网络,主要数据收集方式为患者独立填写,主要信息提供者为患者。定性评价显示量表在产生条目、回答选项、回忆时间、患者对量表的理解力、量表管理模式和数据收集方法等方面有良好的内容效度。本研究流程严谨,定量技术方法先进,定性研究方法详实,具有充分的中华文化特色,研究力量来源广泛,患者特征多样,信息来源全面,方法学和报道质量较高,有良好的创新性和科研及临床意义。但由于现代测试理论的发展仍不完全成熟,所以本研究也不可避免存在特定局限,故还需进一步展开后续研究,提升量表质量。
其他文献
在参考大量文献并结合实地调查的基础上,从冬枣的生物学特性和环境条件两个方面,系统分析冬枣落花落果的原因,并提出相应的防治对策,为解决冬枣的落花落果问题提供一定的理论依据
满族发源于我国东北地区——白山黑水之间,在其漫长的历史发展过程中融合了蒙、汉、回等其他民族的文化而形成了独特的满族文化。孕育了多种多样的民间艺术形式,与美化生活、
血管周围间隙(Perivascular spaces, PVS)是在一个多世纪前由德国病理学家R.Virchow和法国生物学、组织学家C.P.Robin提出,后来命名为Virchow-Robin腔(Virchow-Robin space,
目的探讨手术室运用PDCA模式提高腹腔镜器械清洗合格率的效果。方法本科2016年8~12月(实施PDCA模式前)清洗腹腔镜器械200套,2017年1~7月(实施PDCA模式后)清洗腹腔镜器械200套。将两
目前社会对电力的需求越来越大,对供电质量和可靠性的要求也越来越高。变电站选址与定容作为配网规划中的基础性优化问题,不仅可以带来有效的经济效益,而且可以提高未来网络
采茶戏是地方小戏,产生于民间,流传于民间,至今已有数百年的历史。采茶戏具有浓郁的生活气息,不仅题材和内容贴近生活,很多动作也来源于生活,表演载歌载舞,真实而生动地反映
继佘祥林案、王海军案、杜培武案等后,又接连发生了赵作海案,面对这些有违社会正义、自由的冤假错案的频繁发生,无疑使人们对法律和司法机关大失信心。著名的英国哲学家培根
高等职业教育是伴随着我国经济建设和社会进步而逐渐发展起来的一种新型的高等教育类型,是我国高等教育的重要组成部分。从上世纪90年代开始,我国高等职业教育得到了较快的发展
课堂参与是指学生在课堂上的一种活动,例如,课堂讨论,提问问题,回答问题及课堂辩论等。新的大学英语课程要求中规定外语教学中教师要逐步退出中心领导地位,要注重以学生为中心,要重
进入21世纪以来,儿童阅读推广活动蓬勃发展,各种推荐书目涌现。推荐书目关乎儿童阅读推广的实质内容,但当前对儿童阅读推荐书目的理论研究多处于感性、混沌、零散状态,亟需进