论文部分内容阅读
随着老龄化社会的到来,腰椎退行性疾病(lumbar degenerative disease,LDD)的患病率将持续增加,其中以腰椎滑脱、腰椎间盘突出症及腰椎管狭窄最为常见。对退行性变的脊柱节段进行椎间融合手术,常应用于治疗保守治疗无效的退行性腰椎疾病,其优势在于可以有效减轻神经压迫症状、稳定脊柱节段并恢复腰椎前凸,矫正畸形。近些年针对腰椎退行性变的脊柱外科手术技术和植入物取得了显著的进步,包括开放性融合手术的改良以及经通道椎间融合技术、椎间孔镜为代表的微创手术技术。在众多的手术治疗方法中,腰椎后路椎间融合(posterior lumbar interbody fusion,PLIF)手术因其入路相对简单,手术相对安全、椎间融合率高、手术效果好,仍被广泛应用于脊柱外科治疗腰椎滑脱和腰椎管狭窄症。然而,与其他手术一样,PLIF的手术效果偶尔会受到术后并发症的影响。其中手术部位感染(surgical site infection,SSI)是一种常见的术后并发症,但在脊柱手术中可能会导致严重后果。术后感染治疗进展缓慢,导致非计划多次手术,住院时间延长,增加患者痛苦,患者治疗满意度降低,并且再入院的风险增加。而再入院率增加导致公共保健费负担的加重是另一个当下值得关注的问题。设计这项回顾性研究,目的是收集大量相关病史资料,利用数据挖掘技术探究腰椎退行性疾病患者行腰椎后路椎间融合术后手术部位感染发生的相关危险因素,建立风险评估预测模型,并初步尝试于实际临床工作验证该模型的临床实用价值,从而为临床上制定PLIF术后发生感染风险的措施提供一定的参考依据。本研究分为三部分,现将各部分内容概述如下。第一部分腰椎后路椎间融合术后感染的危险性因素分析目的:统计分析腰椎后路椎间融合术后发生感染的相关危险因素,为后期制定预测模型提供数据基础,并为制定预防PLIF术后发生感染的措施提供一定的参考依据。方法:回顾性研究2019年6月至2021年6月在北京及河北省部分三级甲等医院脊柱外科住院接受腰椎后路椎间融合术治疗的患者病历资料(患者相关病例数据结果由中卫云医疗数据分析与应用技术研究院经过数据处理分析提供)。使用SPSS Modeler 20进行统计学分析。首先采用聚类划分方法中的K-means算法对数据中大量的未感染的患者进行聚类,K-means聚类算法可以使每一类内的成员相似度达到最大,而类与类之间的相似度最小。聚类之后,每一类按一定的百分比进行随机选取,这样经过预处理后的目标维度后分别用平均±标准差(SD)和计数(百分比)对连续变量和分类变量进行表征。比较SSI和非SSI组的分类数据使用卡方或Fisher的精确检验,并酌情使用Student-t检验或Mann WhitneyU检验连续数据。在单变量分析中,找到在P<0.05的统计水平上被测试为显著的变量,随后将这些变量作为自变量纳入多元Logistic回归模型进行拟合。采用逐步向后消除方法删除不显著的变量,最终得到对是否感染具有显著影响的变量。这里采用Hosmer-Lemeshow(H-L)检验确定最终模型的拟合优度,P>0.05表示可接受的结果;采用Nagelkerke R2进一步量化,该指标在0-1之间越大则说明预测的准确性越高。结果:本研究纳入回顾性统计分析总计8764例患者数据,其中373名患者被诊断为SSI,发病率为4.4%(95%CI,2.2%至6.5%)。K-means聚类之后,非SSI组419例,SSI组373例,由124名男性和249名女性组成,平均年龄为55.9岁(SD,14.6岁)。SSI的发病时间中位时间为术后9天,最早发生在术后第3天,最晚发生在术后第76天。在这些SSI中,268个是浅部感染,105个是深部感染。所有373例SSI患者均常规进行微生物培养,357例(95.7%)培养阳性。在12例深部SSI患者和4例浅表SSI患者中,未分离出任何微生物。单因素分析显示,SSI组与非SSI组在年龄分类变量、BMI、糖尿病、慢性心脏病、肾功能不全、术前停留时间、总住院时长、ASA分级Ⅲ级及以上、手术持续时间、术后引流量、术后抗生素使用时长(天)、红细胞计数,淋巴细胞计数分类变量、空腹血糖、空腹血糖分类变量方面有显着性差异(P<0.05)。两组在性别、吸烟、高血压、脑血管病、肺部疾病、慢性肝病、总蛋白计数及分类变量、白蛋白计数及分类变量、白细胞及中性粒细胞计数及分类变量、血红蛋白、红细胞压积、血小板计数和分类变量中无显着性差异。结论:本研究中发现PLIF治疗腰椎退行性疾病,SSI发病率为4.4%。体重指数,ASA分级Ⅲ级及以上,慢性心脏病,糖尿病和肾功能不全,手术时间延长六个因素确定与SSI独立相关。第二部分基于数据挖掘技术的腰椎后路椎间融合术后感染风险的预测模型构建目的:在第一部分研究的基础上,采用决策树分类、随机森林分类、人工神经网络分类算法等数据挖掘技术进行术后感染变量的分析及精度对比,尝试构建客观准确的术后感染预测模型,以便临床上可以客观、准确地判断PLIF术后发生手术部位感染的风险。方法:在第一部分研究中得到了发生感染的6个独立影响因素后,本研究回到总样本中重新采用K-means聚类分析对原始样本进行数据预处理,之后,对数据维度进行赋值,使用SPSS Modeler 20数据建模系统作为工具,分别采用C4.5决策树、C5.0决策树、随机森林(RF)、支持向量机(SVM)以及人工神经网络(ANN)算法进行对比分析,并将决策树模型与随机森林模型中的分支节点内的样本进行控制,设定阈值为10,即分支节点的最小样本数要高于阈值10,否则将进行剪枝处理。之后,设定随机种子,并分别随机选取样本总数量中的70%、80%、90%以及100%进行分类模型构建,提升模型的客观性。对比选出最为精准的分类方法后,将结果带入100%样本数据中,进行汇总,可得到术后容易感染的病患特征,即感染模型。结果:在总样本中重新采用K-means聚类分析,对原始样本进行数据预处理聚类4类后,获得未感染病患数据453个,感染样本为373个,由此共计826条数据,未感染与感染比例大致为1.2:1,后对数据维度进行赋值,分别采用C4.5决策树、C5.0决策树、随机森林(RF)、支持向量机(SVM)以及人工神经网络(ANN)算法进行建模,并对结论进行对比分析,可以得到在本研究中,以随机森林模型进行分类可获得较高的精度,为90.6%,我们将SPSS Modeler 20得到的随机森林分类结果进行汇总,最终可得到术后容易感染的病患特征即得到两种感染模式:((BMI=1)and(SD=1)and(ASA=1)and(RI=1))or(BMI=0)and(SD=1)and(DM=1)and(RI=1)。结论:在本研究中,相对于应用逻辑回归分析,使用数据挖掘技术对样本进行数据处理,可获得更为客观、准确的风险预测模型。随机森林分类算法应用于本研究中可获得90.6%的平均精度,并得到感染模型(1)病患若肥胖、患肾功能不全、ASA分级Ⅲ级及以上、心脏病且手术时间大于或等于3小时,则容易感染;(2)病患若无肥胖,但同时患糖尿病,肾功能不全且手术时间大于或等于3小时,则容易感染。第三部分腰椎后路椎间融合手术术后感染风险的预测模型的临床应用和初步验证目的:观察和验证构建的第二部分研究所获得的感染风险预测模型的精度,确定该模型在实际临床应用中的适用价值。方法:本研究对2016年1月到2019年6月期间,在河北医科大学第三医院住院接受PLIF治疗的腰椎退行性疾病患者的病例相关数据进行统计分析。采用第二部分构建的“感染风险预测模型”对纳入研究的对象进行评估筛选。按研究的进展情况和病例收集进度,分别建立相对的小、中、大样本,为避免该部分研究的样本数量所带来的算法优略势,以原始样本数据中获得精度最高的随机森林(RF)、支持向量机(SVM)、C5.0分类算法,分别验证“感染风险预测模型”的精度,获得最高精度的最终模型。结果:本部分研究的第一阶段(2016年1月至2017年10月)纳入研究654例接受PLIF手术治疗的患者,实际感染21例,感染发生率3.2%;第二阶段(2017年11月至2018年6月)累计纳入研究867例,实际感染累计28例,感染率3.2%;第三阶段(2018年7月至2019年6月)纳入研究累计1286例,实际感染48例,感染率约3.7%。三个阶段累计病例分别建立样本,并以第二部分研究平均精度最高的随机森林(RF)、支持向量机(SVM)、C5.0分类算法模型分别预测结果,三种算法均精确度随着样本量的增大而提高。其中随机森林算法仍最为精确,在三种不同的数据样本中精度分别达到84%,84.8%以及87.5%,其次为支持向量机、最后是C5.0决策树。本部分实验中,随机森林的最高精度为87.5%,这与第二部分测试得到的90.6%的精度较为接近,在合理的误差范围之内。结论:随机森林(RF)、支持向量机(SVM)、C5.0分类算法三个模型分别预测结果,三种算法均精确度随着样本量的增大而提高。其中随机森林算法仍最为精确,在三种不同的数据样本中精度分别达到84%,84.8%以及87.5%。由此可见随机森林的最高精度为87.5%,这与第二部分测试得到的90.6%的精度较为接近,在合理的误差范围之内。