论文部分内容阅读
背景:患者报告结局(Patient-Reported Outcome,PRO)作为传递患者主观感受的重要途径,常用于测量临床研究中患者的症状和功能。然而,不同采集模式下的纵向PRO数据质量却很少被讨论。该研究旨在为临床研究选择电子和纸质两种数据采集模式提供决策依据。通过真实世界研究探索和前瞻性队列研究验证以下的四个目标:(1)识别通过纸质(Paper-and-pencil,P&P)和电子(electronic PRO,ePRO)模式采集的患者流行病学特征;(2)明确PRO数据质量的评价指标;(3)比较不同模式下采集的PRO数据质量,寻找影响数据质量的危险因素及其纵向轨迹变化趋势;(4)验证两种模式采集PRO数据的等效性。方法:本研究是以数据质量为研究对象的流行病方法学研究。研究的第一部分在多个临床研究项目中提取真实世界PRO数据,获得相关质量现状,之后通过前瞻性设计比较两种数据采集模式,验证第一部分的结果。(1)研究第一部分:2017年12月至2020年8月四川省肿瘤医院为主要中心联合了5家分中心医院,开展了两项以PRO作为主要结局的临床研究。对研究中的PRO数据质量进行分析,提取患者的相关特征和PRO应答等信息,筛选仅采用P&P或ePRO的患者共629名。PRO在术前、术后直至出院的时间点进行评估,使用MD安德森症状量表-肺癌子表和单一条目的生活质量量表共23个条目测量。通过对患者依从性和PRO数据质量低下(以下称为“错误”)进行初步定义,描述每种错误类型占比,在P&P和ePRO之间进行差异性比较和纵向轨迹的描述。尝试使用广义估计方程模型(Generalized Estimating Equation,GEE)找出导致错误的危险因素,并采用分阶段线性回归模型描述错误率随时间变化的趋势。(2)研究第二部分:采用实用性临床试验设计,包括随机分组至不同采集模式(P&P或ePRO)中的交叉随机对照试验(Randomized Controlled Trial,RCT)和患者自愿选择采集模式的队列研究。2021年4月至2021年8月在四川省肿瘤医院拟行肺部手术的患者作为研究对象,收集患者的相关特征和其他康复测量客观指标。PRO量表选择共9个条目的肺部手术患者围手术期症状量表,在术前、术后每天直至出院以及出院一个月内每周2次评估。通过分析队列研究中自愿选择P&P或ePRO的患者流行病学特征,回答电子能否完全取代纸质;通过专家讨论法明确数据质量低下的评价指标,比较两组的错误率、依从性和纵向轨迹,调查患者PRO数据质量现状;运用GEE模型验证导致错误的危险因素,并运用分阶段线性回归模型验证其纵向变化趋势。计算交叉RCT研究队列中两种模式下PRO结果的组内相关系数(Intraclass Correlation Coefficient,ICC)和Bland-Altman分析结果,检验两采集模式下PRO结果的等效性。结果:(1)第一部分:在参与临床研究的629名患者中,49.4%(311/629)患者出现了错误。错误的类型初步定义为6种,其中“条目缺失”(64.7%)和“修改无患者签名”(28%)占比最高。P&P错误率显著高于ePRO(P&P vs.ePRO,57.7%vs.30.2%,P<0.0001)。分别对每种采集模式寻找其影响因素,发现共同危险因素是教育程度较低(初中及以下;P&P:OR=1.39,95%CI,1.2-1.62,P<0.0001;ePRO:OR=1.82,95%CI,1.22-2.72,P=0.003)、医院等级更高(省级医院;OR=3.34,95%CI,2.10-5.33,P<0.0001;OR=4.73,95%CI,2.18-10.25,P<0.0001)、病情更严重(确诊肺癌且术后病理分期等级>Ⅰvs.非肺癌;OR=1.63,95%CI,1.33-1.99,P<0.0001;OR=2.70,95%CI,1.53-4.75,P<0.0001)。识别每种模式纵向变化轨迹时,发现错误率高峰分别在术后第1天(P&P组,postoperative day 1st,POD1)和POD2(ePRO组),两边均呈现先升后降低的显著变化趋势。(2)第二部分:前瞻性研究中共筛选了413名患者纳入后续的分析。其中队列研究中分别有243和96人选择了P&P和ePRO;RCT组共74人,纸质和电子各37人。PRO数据质量评估维度包括完整性和准确性;错误类型最终定义为8种:“条目缺失”(54%)、“录入数据错误”(12%)、“涂改选项无患者签名”(10%)、“患者签署日期遗漏”(8.7%)、“无研究者签名”(7.5%)、“条目多选”(4.3%)、“无患者签名”(3.4%)以及“患者填写日期错误”(0.21%)。其中45.28%(187/413)的患者出现了错误。队列研究中选择P&P的患者年龄更大(P&P vs.ePRO,63.8±8.59岁vs.55.76±9.99岁,P<0.0001)、教育程度更低(初中及以下,74%vs.26%,P<0.0001)、合并症更多(有合并症,45%vs.30%,P=0.0079)和术后住院时间更长(5天vs.4天,P=0.0129)。住院期间,P&P错误率显著高于ePRO(58.33%vs.22.63%,P<0.0001);但在出院后,电话随访的错误率显著低于ePRO(12.50%vs.31.28%,P<0.0001)。对每一种模式验证导致错误的危险因素,发现共同危险因素是未就业(未就业vs.全职或兼职就业;OR=2.4,95%CI,1.06-5.43,P=0.0367;OR=3.13,95%CI,1.78-5.52,P<0.0001)。P&P组的其他危险因素有教育程度低和男性,ePRO组为年龄大和身体状态差。错误率纵向轨迹在P&P中的POD1和ePRO中POD2达到高峰,P&P呈现先升后降的显著趋势,而ePRO为先升后趋于稳定。RCT中P&P和ePRO组患者在年龄(50.08±11.57 vs.53.78±12.69,P=0.1939)、教育程度(初中及以下,37.84%vs.29.73%,P=0.4609)和手术入路(单孔,70.27%vs.81.08%,P=0.2785)等特征上均具有高度可比性。研究结局患者依从性和PRO错误率均无显著组间差异(P>0.05),但住院期间P&P错误率仍略高于ePRO(35.14%vs.16.22%,P=0.0625)。错误率的纵向轨迹无显著组间差异(P=0.0659),并呈现随机高峰或稳定趋势。等效性检验显示两模式间的PRO结果一致性高(ICC=0.903),且交叉设计产生的延滞效应影响小(P>0.05)。结论:医疗保健体系中电子化推广是一种大势所趋,ePRO可以提高患者依从性有效控制因失访带来的“失访偏倚”,减少数据错误控制信息偏倚中的系统误差,平衡出院后的医患负担和数据准确性。但电子采集带来的“选择偏倚”十分显著,在适应电子技术上也需要更长的时间。或许不同采集模式的相互补充更能促进真实世界临床研究的落地。