论文部分内容阅读
背景目前,公开发表的一些医学研究的结果不能被重现以及学术论文被撤稿的问题正在成为生物医学研究者关注的焦点。文献的报告质量不佳是造成该现象的原因之一。报告质量低的文献会影响读者对研究过程有效性和真实性的客观评价。倾向性评分作为观察性研究中控制混杂偏倚的一种方法,已经被广泛应用到医学研究中。但是,对应用倾向性评分文献的报告质量及缺失值处理和报告情况的相关研究较少。评估胃癌领域应用倾向性评分文献的报告质量、探讨其影响因素以及有关缺失值报告情况的研究尚未见报道。目的(1)评估胃癌领域应用倾向性评分文献的报告质量,探索其在报告方面存在的缺陷及影响报告质量的因素;(2)对胃癌领域应用倾向性评分文献中缺失值的报告情况及相关信息进行分析;(3)希望本研究可以引起研究者、生物医学期刊编辑及同行评议专家对应用倾向性评分文献报告质量的关注,确保倾向性评分方法在医学研究中的实施更加科学严谨,报告形式更加完整规范,确保高质量研究结果的输出,为医务工作者和医疗卫生决策者正确评价和合理应用倾向性评分文献的研究结果提供理论依据。方法(1)采用横断面研究方法,计算机检索Pub Med数据库,收集有关胃癌领域应用倾向性评分方法的文献,检索语言为英文,检索日期为从建库至2020年6月10日;(2)两名研究人员根据文献的纳入和排除标准,对文献进行筛选及数据提取。收集的文献信息包括:杂志名称、发表的年份、数据来源、研究类型、作者数量、统计方法的数量、文献页数、第一作者单位及来自的地区、研究中是否有统计学家或流行病学家参与、是否有基金支持、是否是国际合作、杂志的SCI(Science Citation Index)影响因子及文献被引次数等;(3)采用参考“加强观察性流行病学研究报告质量声明”(Strengthening the Reporting of Observational Studies in Epidemiology,STROBE)和其他文献后自行设计的倾向性评分报告质量评价清单对纳入文献进行报告质量评价;(4)对于正态分布的连续资料采用均数及标准差((?)±s)进行描述,两组间均数的比较采用两独立样本t检验,多组间均数的比较采用单因素方差分析(Analysis of Variance,ANOVA);对于分类资料计算率、构成比和比值比(Odds Ratio,OR)及其95%置信区间(Confidence Interval,CI),采用卡方检验或Fisher确切概率法比较不同组间构成比和率的差异。采用多因素线性回归分析探索影响倾向性评分报告质量得分的相关因素,并计算均数差(Mean Difference,MD)及其95%CI。以倾向性评分报告质量得分分为高质量组与低质量组后,采用Logistic回归分析影响其报告质量高低的因素,并计算OR及其95%CI。数据的录入及分析均采用SPSS18.0统计软件完成。结果1检索结果及纳入文献的基本特征初次检索出966篇文献,通过剔除重复文献、审阅文献题目和摘要后删除不相关文献718篇,经全文阅读后,排除73篇,最终纳入175篇文献。应用倾向性评分匹配的文献有158篇、倾向性评分分层7篇、倾向性评分加权14篇以及倾向性评分协变量调整4篇,应用两种及以上倾向性评分方法的文献有9篇;发表篇数前3位的杂志是《胃癌》(23篇,13.1%)、《手术内窥镜检查及其他干预技术》(19篇,10.9%)及《外科肿瘤学年鉴》(14篇,8.0%);有39篇(22.2%)文献作者有统计学家或流行病学家;76.5%(134篇)的文献作者来自亚洲地区;96%(168篇)的文献发表在2014年以后。2纳入文献的倾向性评分报告质量(1)纳入文献的倾向性评分报告质量评价清单所有条目的中位报告率为71.4%。必须报告的14个条目的中位报告率为87.45%,但一些重要条目的报告率比较低;倾向性评分匹配条目的中位报告率为75.3%;倾向性评分加权部分条目的中位报告率为50.0%;(2)文献特征对必须报告条目报告率的影响:影响“列出所收集的变量”(条目2)报告率的因素有“资金支持”(P<0.05);影响“用于计算倾向性评分的模型”(条目3)报告率的因素有“文献页数”、“作者单位”和“统计学和流行病学专家的参与”(P均<0.05)等;(3)文献特征对倾向性评分匹配条目报告率的影响:影响“匹配类型”(条目1)报告率的因素有“研究类型”(P<0.05);影响“匹配比例”(条目3)报告率的因素有“作者的数量”(P<0.05);(4)纳入文献的倾向性评分报告质量得分为0.14~0.91,平均分为0.65±0.12;作者数量>9名的文献报高质量要高于作者数量≤9名的文献(P<0.05);(5)多元线性回归结果显示:作者数量>9名的文献报告质量得分比≤9名的文献高0.054分(95%CI:0.011~0.076,P=0.010);(6)多因素Logistic回归结果显示:作者数量>9名的文献报告质量高(OR=4.064,95%CI:1.832~9.018,P=0.001);文献页数>9页的报告质量较好(OR=2.504,95%CI:1.120~5.597,P=0.025);作者中有统计学家或者流行病学家参与的文献报告质量更高(OR=2.502,95%CI:1.059~5.915,P=0.037)。3纳入文献中有关倾向性评分匹配报告的具体情况本研究中采用倾向性评分匹配的文献有158篇(90.3%);(1)109篇(69.0%)文献报告了匹配类型,其中104篇(95.4%)文献使用贪婪匹配;(2)使用贪婪匹配的文献中,有38篇(36.5%)采用有卡钳值的邻近匹配,29篇(27.9%)使用邻近匹配;(3)61篇涉及到卡钳值的文献中,60篇(98.4%)报告了具体的卡钳值;(4)143篇(90.5%)报告了匹配比例,其中采用“1:1”匹配的有124篇(78.5%);(5)115篇(72.8%)未报告进行匹配时是否使用了放回抽样的方法;(6)129篇(81.6%)报告了匹配后进行组间协变量均衡性检验,其中103篇(65.1%)使用假设检验法,26篇(16.5%)使用标准化差异法,其中有14篇(53.9%)采用标准化差异的10%的作为检验协变量平衡的标准;(7)主要结局指标无统计学意义的文献匹配比例的报告率高于主要结局指标有统计学意义的文献(P=0.016);(8)报告倾向性评分分值重叠区域与主要结局指标中有统计意义有关联(OR=0.230,95%CI:0.054~0.974,P=0.046)。4应用倾向性评分匹配的文献中使用标准化差异法检验协变量平衡以及卡钳值与作者中是否有统计学家或流行病学家参与之间的相关性分析在129篇报告检验协变量平衡方法的文献中有28篇(21.1%)使用了标准化差异法,使用适当的检验协变量平衡方法与作者中是否有统计学家或流行病学家的参与存在着弱相关关系,Spearman相关系数r=0.277,P=0.001;使用推荐的卡钳值(倾向性得分的标准差的20%)与作者中是否有统计学家或流行病学家之间有弱的相关性(r=0.233),但是无统计学意义(P=0.073)。5应用倾向性评分的文献中有关缺失值处理的报告质量情况本研究有64篇(36.6%)文献报告了缺失值的相关信息;(1)43篇(67.2%)文献报告了缺失值的比例;(2)26篇(40.6%)文献报告了缺失值产生的原因,其中失访占23.4%;(3)63篇(98.4%)文献未报告缺失机制,1篇(1.6%)报告了缺失机制为完全随机缺失;(4)46篇(71.9%)文献处理缺失数据使用列表删除法,1篇(1.6%)使用了多重插补法;(5)54篇(84.4%)文献没有进行缺失值的敏感性分析;(6)23篇(35.9%)文献对缺失值的描述符合STROBE指南要求。结论胃癌领域内应用倾向性评分文献的报告质量尚可,评价清单中所有条目的中位报告率为71.4%,但有些重要条目的报告率较低。资金支持、文献页数、作者单位、数据来源、统计方法数量、研究类型及杂志的SCI影响因子等因素影响一些条目的报告率。作者数量多、文献页数多以及有统计学家或流行病学家参与的研究倾向性评分报告质量较高。缺失值的相关信息报告率较低。大部分文献对缺失值的描述不符合STROBE指南要求。研究者、同行评议专家和期刊编辑在制作、评议和编审倾向性评分文稿时,应严格遵循倾向性评分报告规范,关注缺失数据的信息报告情况,进一步提高研究的报告质量和方法学质量,使应用倾向性评分方法的研究结果更加真实地为医疗卫生实践服务。