基于数据挖掘技术的腰椎后路椎间融合术后感染的危险性因素分析及预测模型的构建

来源 :河北医科大学 | 被引量 : 0次 | 上传用户:jimlancer
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着老龄化社会的到来,腰椎退行性疾病(lumbar degenerative disease,LDD)的患病率将持续增加,其中以腰椎滑脱、腰椎间盘突出症及腰椎管狭窄最为常见。对退行性变的脊柱节段进行椎间融合手术,常应用于治疗保守治疗无效的退行性腰椎疾病,其优势在于可以有效减轻神经压迫症状、稳定脊柱节段并恢复腰椎前凸,矫正畸形。近些年针对腰椎退行性变的脊柱外科手术技术和植入物取得了显著的进步,包括开放性融合手术的改良以及经通道椎间融合技术、椎间孔镜为代表的微创手术技术。在众多的手术治疗方法中,腰椎后路椎间融合(posterior lumbar interbody fusion,PLIF)手术因其入路相对简单,手术相对安全、椎间融合率高、手术效果好,仍被广泛应用于脊柱外科治疗腰椎滑脱和腰椎管狭窄症。然而,与其他手术一样,PLIF的手术效果偶尔会受到术后并发症的影响。其中手术部位感染(surgical site infection,SSI)是一种常见的术后并发症,但在脊柱手术中可能会导致严重后果。术后感染治疗进展缓慢,导致非计划多次手术,住院时间延长,增加患者痛苦,患者治疗满意度降低,并且再入院的风险增加。而再入院率增加导致公共保健费负担的加重是另一个当下值得关注的问题。设计这项回顾性研究,目的是收集大量相关病史资料,利用数据挖掘技术探究腰椎退行性疾病患者行腰椎后路椎间融合术后手术部位感染发生的相关危险因素,建立风险评估预测模型,并初步尝试于实际临床工作验证该模型的临床实用价值,从而为临床上制定PLIF术后发生感染风险的措施提供一定的参考依据。本研究分为三部分,现将各部分内容概述如下。第一部分腰椎后路椎间融合术后感染的危险性因素分析目的:统计分析腰椎后路椎间融合术后发生感染的相关危险因素,为后期制定预测模型提供数据基础,并为制定预防PLIF术后发生感染的措施提供一定的参考依据。方法:回顾性研究2019年6月至2021年6月在北京及河北省部分三级甲等医院脊柱外科住院接受腰椎后路椎间融合术治疗的患者病历资料(患者相关病例数据结果由中卫云医疗数据分析与应用技术研究院经过数据处理分析提供)。使用SPSS Modeler 20进行统计学分析。首先采用聚类划分方法中的K-means算法对数据中大量的未感染的患者进行聚类,K-means聚类算法可以使每一类内的成员相似度达到最大,而类与类之间的相似度最小。聚类之后,每一类按一定的百分比进行随机选取,这样经过预处理后的目标维度后分别用平均±标准差(SD)和计数(百分比)对连续变量和分类变量进行表征。比较SSI和非SSI组的分类数据使用卡方或Fisher的精确检验,并酌情使用Student-t检验或Mann WhitneyU检验连续数据。在单变量分析中,找到在P<0.05的统计水平上被测试为显著的变量,随后将这些变量作为自变量纳入多元Logistic回归模型进行拟合。采用逐步向后消除方法删除不显著的变量,最终得到对是否感染具有显著影响的变量。这里采用Hosmer-Lemeshow(H-L)检验确定最终模型的拟合优度,P>0.05表示可接受的结果;采用Nagelkerke R2进一步量化,该指标在0-1之间越大则说明预测的准确性越高。结果:本研究纳入回顾性统计分析总计8764例患者数据,其中373名患者被诊断为SSI,发病率为4.4%(95%CI,2.2%至6.5%)。K-means聚类之后,非SSI组419例,SSI组373例,由124名男性和249名女性组成,平均年龄为55.9岁(SD,14.6岁)。SSI的发病时间中位时间为术后9天,最早发生在术后第3天,最晚发生在术后第76天。在这些SSI中,268个是浅部感染,105个是深部感染。所有373例SSI患者均常规进行微生物培养,357例(95.7%)培养阳性。在12例深部SSI患者和4例浅表SSI患者中,未分离出任何微生物。单因素分析显示,SSI组与非SSI组在年龄分类变量、BMI、糖尿病、慢性心脏病、肾功能不全、术前停留时间、总住院时长、ASA分级Ⅲ级及以上、手术持续时间、术后引流量、术后抗生素使用时长(天)、红细胞计数,淋巴细胞计数分类变量、空腹血糖、空腹血糖分类变量方面有显着性差异(P<0.05)。两组在性别、吸烟、高血压、脑血管病、肺部疾病、慢性肝病、总蛋白计数及分类变量、白蛋白计数及分类变量、白细胞及中性粒细胞计数及分类变量、血红蛋白、红细胞压积、血小板计数和分类变量中无显着性差异。结论:本研究中发现PLIF治疗腰椎退行性疾病,SSI发病率为4.4%。体重指数,ASA分级Ⅲ级及以上,慢性心脏病,糖尿病和肾功能不全,手术时间延长六个因素确定与SSI独立相关。第二部分基于数据挖掘技术的腰椎后路椎间融合术后感染风险的预测模型构建目的:在第一部分研究的基础上,采用决策树分类、随机森林分类、人工神经网络分类算法等数据挖掘技术进行术后感染变量的分析及精度对比,尝试构建客观准确的术后感染预测模型,以便临床上可以客观、准确地判断PLIF术后发生手术部位感染的风险。方法:在第一部分研究中得到了发生感染的6个独立影响因素后,本研究回到总样本中重新采用K-means聚类分析对原始样本进行数据预处理,之后,对数据维度进行赋值,使用SPSS Modeler 20数据建模系统作为工具,分别采用C4.5决策树、C5.0决策树、随机森林(RF)、支持向量机(SVM)以及人工神经网络(ANN)算法进行对比分析,并将决策树模型与随机森林模型中的分支节点内的样本进行控制,设定阈值为10,即分支节点的最小样本数要高于阈值10,否则将进行剪枝处理。之后,设定随机种子,并分别随机选取样本总数量中的70%、80%、90%以及100%进行分类模型构建,提升模型的客观性。对比选出最为精准的分类方法后,将结果带入100%样本数据中,进行汇总,可得到术后容易感染的病患特征,即感染模型。结果:在总样本中重新采用K-means聚类分析,对原始样本进行数据预处理聚类4类后,获得未感染病患数据453个,感染样本为373个,由此共计826条数据,未感染与感染比例大致为1.2:1,后对数据维度进行赋值,分别采用C4.5决策树、C5.0决策树、随机森林(RF)、支持向量机(SVM)以及人工神经网络(ANN)算法进行建模,并对结论进行对比分析,可以得到在本研究中,以随机森林模型进行分类可获得较高的精度,为90.6%,我们将SPSS Modeler 20得到的随机森林分类结果进行汇总,最终可得到术后容易感染的病患特征即得到两种感染模式:((BMI=1)and(SD=1)and(ASA=1)and(RI=1))or(BMI=0)and(SD=1)and(DM=1)and(RI=1)。结论:在本研究中,相对于应用逻辑回归分析,使用数据挖掘技术对样本进行数据处理,可获得更为客观、准确的风险预测模型。随机森林分类算法应用于本研究中可获得90.6%的平均精度,并得到感染模型(1)病患若肥胖、患肾功能不全、ASA分级Ⅲ级及以上、心脏病且手术时间大于或等于3小时,则容易感染;(2)病患若无肥胖,但同时患糖尿病,肾功能不全且手术时间大于或等于3小时,则容易感染。第三部分腰椎后路椎间融合手术术后感染风险的预测模型的临床应用和初步验证目的:观察和验证构建的第二部分研究所获得的感染风险预测模型的精度,确定该模型在实际临床应用中的适用价值。方法:本研究对2016年1月到2019年6月期间,在河北医科大学第三医院住院接受PLIF治疗的腰椎退行性疾病患者的病例相关数据进行统计分析。采用第二部分构建的“感染风险预测模型”对纳入研究的对象进行评估筛选。按研究的进展情况和病例收集进度,分别建立相对的小、中、大样本,为避免该部分研究的样本数量所带来的算法优略势,以原始样本数据中获得精度最高的随机森林(RF)、支持向量机(SVM)、C5.0分类算法,分别验证“感染风险预测模型”的精度,获得最高精度的最终模型。结果:本部分研究的第一阶段(2016年1月至2017年10月)纳入研究654例接受PLIF手术治疗的患者,实际感染21例,感染发生率3.2%;第二阶段(2017年11月至2018年6月)累计纳入研究867例,实际感染累计28例,感染率3.2%;第三阶段(2018年7月至2019年6月)纳入研究累计1286例,实际感染48例,感染率约3.7%。三个阶段累计病例分别建立样本,并以第二部分研究平均精度最高的随机森林(RF)、支持向量机(SVM)、C5.0分类算法模型分别预测结果,三种算法均精确度随着样本量的增大而提高。其中随机森林算法仍最为精确,在三种不同的数据样本中精度分别达到84%,84.8%以及87.5%,其次为支持向量机、最后是C5.0决策树。本部分实验中,随机森林的最高精度为87.5%,这与第二部分测试得到的90.6%的精度较为接近,在合理的误差范围之内。结论:随机森林(RF)、支持向量机(SVM)、C5.0分类算法三个模型分别预测结果,三种算法均精确度随着样本量的增大而提高。其中随机森林算法仍最为精确,在三种不同的数据样本中精度分别达到84%,84.8%以及87.5%。由此可见随机森林的最高精度为87.5%,这与第二部分测试得到的90.6%的精度较为接近,在合理的误差范围之内。
其他文献
脑膜癌病(Leptomeningeal Carcinomatosis,LMC)是肿瘤晚期的严重并发症,其定义为恶性肿瘤细胞(常见于乳腺癌、肺癌、黑色素瘤)通过各种途径转移至脑膜、脊膜及蛛网膜下腔所造成的疾病。LMC患者的总体死亡率高,预后极差,如果不进行治疗,中位生存期仅为4~6周。即使应用全身或局部化疗、放疗、分子靶向治疗和免疫治疗等,也仅能将患者的中位生存期从1~3个月延长至3~11个月。鞘内
学位
目的:脑出血(intracerebral hemorrhage,ICH)作为一种严重的脑血管疾病占所有中风类型的10-15%左右,有较高的死亡率,较易出现严重的二次伤害,对于人类公共健康产生重大影响。脑出血的病理性因素主要是收缩压长期处于较高状态导致从而高血压以及脑淀粉样血管病变。脑出血可导致神经递质的异常释放、脑缺血、细胞膜去极化、线粒体功能紊乱等,并且容易引起神经系统的功能障碍。据相关报道目前
学位
目前,随着社会各方面高速发展,创伤患者不断增多,世界各地胸壁创伤均普遍。多个国家的统计资料显示,胸部创伤可以占到所有创伤病例的9%-25%,其中肋骨骨折是最常见的胸部创伤,可占胸部创伤的50%-80%。中国人口众多,保守估计,肋骨骨折人数每年可达150-200万。多发肋骨骨折,尤其连枷胸,可导致多种并发症,影响预后和生活质量,甚至危及生命。目前随着医学的快速发展,内固定器材及微创手术理念的进步,还
学位
急性缺血性脑卒中(Acute ischemic stroke,AIS)是导致世界各国居民死亡和残疾的主要原因之一,给世界各国均造成了严重的经济负担。在脑卒中发病的早期,及时给予阿替普酶静脉溶栓(Intravenous thrombolysis,IVT)药物治疗,能够促使阻塞的脑动脉再通,从而获得较好的临床疗效。AIS患者的IVT治疗具有显著的时间依赖性,脑卒中后患者的功能预后与闭塞血管的再通时间密
学位
喉鳞状细胞癌(laryngeal squamous cell carcinoma,LSCC)是喉癌的主要病理类型,肿瘤的局部浸润和远器官转移是导致患者疗效差及生存率低的主要因素。目前,长非编码RNA(long nc RNA,lnc RNA)在恶性肿瘤中的研究备受关注,越来越多的证据表明,lnc RNA在多种肿瘤中具有很高的组织特异性,并对肿瘤的发生和发展发挥着重要作用,但在LSCC中关于lnc R
学位
<正>-85万!这是有着14.1亿人口的中国在2022年的人口增量。1月17日,备受关注的2022年人口主要数据出炉。2022年我国出生人口为956万人,出生率为6.77‰;死亡人口1041万人,死亡率为7.37‰;人口自然增长率为-0.60‰。这是自1962年以来我国人口首次负增长,人口的警钟已无法忽略。人口生育率为何如此低迷?为了破解这道难题,半个世纪来,我国的生育政策不断调整:从1980年“
期刊
脑膜瘤是中枢神经系统多见的原发性颅内肿瘤之一,来源于蛛网膜帽状细胞,紧贴硬脑膜。发病率仅次于胶质瘤,占颅内肿瘤的35%左右,并且呈逐年升高趋势。根据2016年WHO中枢神经系统肿瘤分类,脑膜瘤分为WHO I级(良性脑膜瘤)、WHO II级(非典型脑膜瘤)和WHO III级(恶性脑膜瘤)3个等级,其中WHO I级脑膜瘤占80%左右,而WHO II级及III级脑膜瘤,分别占10-18%和2-4%。大多
学位
第一部分Gasdermin D在糖尿病肾组织及高糖诱导足细胞中的表达目的:糖尿病是全球范围内的一种威胁人类健康的慢性疾病,发病率高,致死率高、多脏器受累,预后差。统计数据显示,到2045年糖尿病患者将达到7.83亿,在此期间,世界人口估计增加20%,而糖尿病患者人数估计增加46%;2021年统计分析显示:有670万成年人因糖尿病或其并发症死亡,大约1/3的糖尿病死亡年龄小于60岁。糖尿病的慢性并发
学位
冠状面胫股关节半脱位是膝关节骨性关节炎患者常见的影像学表现,有研究认为其与无法解释的膝关节疼痛有关。但不同研究中对手术治疗伴有冠状面胫股关节半脱位的膝关节骨性关节炎患者的效果、半脱位程度与髌骨高度等其他下肢力线参数之间的关系等方面存在争议。而正常的髌骨位置对维持膝关节稳定性及正常功能活动有重要作用,准确测量髌骨高度对评估膝关节稳定性及制定手术计划有重要意义。既往文献报道了多种测量髌骨高度的方法,但
学位
甲状腺癌(thyroid cancer,TC)是内分泌系统最常见的恶性肿瘤,近30年来在世界范围内发病率逐年上升。根据细胞来源和分化状态,TC分为四种主要病理类型:乳头状甲状腺癌(papillary thyroid cancer,PTC)、滤泡状甲状腺癌(follicular thyroid cancer,FTC)、未分化甲状腺癌(anaplastic thyroid cancer,ATC)起源于
学位