论文部分内容阅读
目的术后慢性疼痛(Chronic Postsurgical Pain,CPSP)是一种发病率高、危害性大的疾病。本研究针对老年骨科手术患者,通过分析该人群中CPSP的发生现状和危险因素,并采用多种机器学习(Machine Learning,ML)和合成少数类过采样技术(Synthetic Minority Oversampling Technique,SMOTE)算法,旨在探讨老年骨科手术患者CPSP问题的普遍性和严重性,并构建具备临床普适性和推广性的老年骨科手术患者CPSP最优预测模型。方法本研究分三个部分。第一部分:选择2020年1月1日至2020年10月19日在宁夏医科大学总医院接受手术治疗的老年骨科患者。基于循证医学证据,设计CPSP结构性调查问卷,在患者术后3个月进行对CPSP的发生现状进行电话随访,内容包括:(1)参考2019年国际疼痛学会(International Association for the Study of Pain,IASP)对国际疾病分类第11版(11th revision of International Classification of Diseases,ICD-11)的修正意见,诊断患者是否发生CPSP;(2)采用疼痛数字评分法(Numerical Rating Scale,NRS)对患者CPSP疼痛程度进行评估,以患者报告的最重疼痛程度(包括静息、运动和咳嗽等时)作为CPSP的疼痛程度,并按NRS评分划分为轻度疼痛(NRS 1-3)、中度疼痛(NRS 4-6)和重度疼痛(NRS 7-10)三个等级;(3)采用神经病理性疼痛量表(Douleur Neuropathique 4 questions,DN4量表)对患者CPSP的性质进行评估,该量表包含4个问题,共10个选项,每个选项回答“是”则记为1分,当受访者得分≥4分时,则可诊断神经病理性疼痛(Neuropathic Pain,NP);(4)采用简明疼痛量表(Brief Pain Inventory,BPI)评估CPSP对患者机体功能的影响,包括日常活动、情绪、行动能力、人际关系、睡眠和生活乐趣6个方面。第二部分:采用双向性队列研究收集模型训练集样本(2020年1月1日至2020年10月19日),采用前瞻性队列研究收集模型验证集样本(2020年10月20日至2021年1月31日)。收集患者人口统计学和临床特征数据作为自变量,包括(1)11项人口统计学数据:年龄、性别、是否有配偶、体重指数(Body Mass Index,BMI)、文化程度、吸烟史、饮酒史、高血压病史、糖尿病病史、术前疼痛史(手术区域和非手术区域两部分);(2)9项临床特征数据:术前炎症状态、美国麻醉师协会(American Society of Anesthesiologist,ASA)分级、麻醉方式、手术类型、手术时长、术中出血量;术后镇痛方式、是否发生术后急性疼痛(Acute Postsurgical Pain,APSP)、术后住院日。根据患者术后3个月是否诊断为CPSP分为两组,采用单因素和多因素Logistic回归方法,分析老年骨科手术患者发生CPSP的危险因素;同时基于ML算法,初步构建逻辑回归(Logistic Regression,LR)、决策树(Decision Tree,DT)、随机森林(Random Forests,RF)、极限树(Extra Trees,ET)、自适应增强(Adaptive Boosting,Ada Boost)和极限梯度提升(e Xtreme Gradient Boosting,XGBoost)六种老年骨科手术患者CPSP预测模型并评估,在训练集中交叉验证后对模型的准确率、精确率、召回率、F1-score和曲线下面积(Area Under Curve,AUC)进行评价,依据召回率确定适宜模型,同时在验证集中对其泛化能力进行检验。第三部分:分析讨论已构建模型的缺陷和不足,结合SMOTE算法对模型进一步更新,利用训练集数据构建LR、DT、RF、ET、Ada Boost、XGBoost六种老年骨科手术患者CPSP预测模型,通过SMOTE数据平衡处理的五折交叉验证方式做超参数调优,设定召回率为择优标准,经交叉验证评估后得到最优模型,外部数据验证其泛化能力后,将模型以网页计算工具可视化呈现。对比SMOTE算法前后各模型交叉验证评估指标的改变,以召回率的提升比例判断SMOTE算法对模型的更新是否有效。结果共1227例老年骨科手术患者被纳入本研究,按照时间顺序,815例构成训练集数据,412例构成验证集数据。第一部分:老年骨科手术患者中CPSP的发生率为30.8%,不同骨科手术类型之间CPSP的发生率没有差异(P>0.05);中、重度CPSP疼痛患者占41%,在同一手术类型中,轻度、中度与重度疼痛比较差异有统计学意义(P<0.001);12%患者的疼痛性质为NP,不同骨科手术类型之间没有差异(P>0.05),疼痛程度与NP的发生呈正相关(P<0.001);老年骨科患者CPSP的发生对机体功能有明显影响(P<0.001),其中日常活动和行动两个方面受影响最大;不同手术类型中CPSP对机体功能的没有差异(P>0.05);不同疼痛程度中,中度和重度疼痛对患者机体功能影响更显著(P<0.001)。第二部分:老年骨科手术患者CPSP发生的独立危险因素,按相关性由大到小依次是:有APSP(OR 8.151)、存在术前非手术区域疼痛史(OR 3.987)、其他四肢手术(OR 3.260)、存在术前手术区域疼痛史(OR 2.393)、长时间住院(OR1.053)、没有配偶(OR 0.409)。基于ML构建的六种老年骨科手术患者CPSP预测模型,均表现出较好的预测效果,各评估指标的交叉验证后结果对比显示:在准确率方面,DT模型、ET模型和Ada Boost表现相似(0.78),较其他三种模型在正确分类(CPSP和非CPSP)预测方面更好;在精确率方面,ET模型和Ada Boost模型表现最佳(0.69);在召回率方面,DT模型最佳(0.51),它正确检出CPSP发生的比例最高;ET模型和XGBoost的F1-score值最高(0.56),而LR模型、ET模型和Ada Boost模型的AUC值更高(0.80)。以召回率为选择标准,DT模型在识别CPSP患者中表现更佳(0.51),是老年骨科手术患者CPSP发生预测的适宜模型;DT模型在外部验证集中表现较好(准确率=0.76、精准率=0.71、召回率=0.44、F1-score=0.54、AUC=0.76),但召回率偏低,需进一步分析原因后处理。第三部分:结合SMOTE算法对已构建模型进一步更新,各评估指标的交叉验证后结果对比显示:ET模型、RF模型和XGBoost在准确率中表现较好(0.78);在精确率方面,XGBoost模型表现最佳(0.67);在召回率方面,LR模型表现最佳(0.64),它正确检出CPSP发生的比例最高;ET模型F1-score值最高(0.60),而除DT模型和ET模型外,其他模型的AUC值均达到0.80。SMOTE算法处理数据后的六种预测模型均表现出较好的预测能力,LR模型为最优模型(召回率=0.64),该模型在外部验证中表现突出(准确率=0.70、精准率=0.52、召回率=0.71、F1-score=0.60、AUC=0.79)。SMOTE算法前后对各模型评估指标进行比较,六种模型的召回率均有提升:LR模型(0.46 vs 0.64),DT模型(0.51 vs 0.56),RF模型(0.48 vs 0.56),ET模型(0.49 vs 0.58),Ada Boost模型(0.46 vs 0.62),XGBoost模型(0.49 vs 0.56),其中最优模型LR召回率提升39%,证明SMOTE算法处理对模型的更新正确且有效。开发了一个基于最优模型的网页风险计算器http://43.138.154.46:5000/。结论老年骨科手术患者的CPSP发生率较高,对机体功能有显著不良影响,需要引起社会的广泛重视;本研究基于ML和SMOTE算法构建的最优模型预测能力强,能高效识别CPSP患者,使用开发的网页计算工具进行CPSP风险预测方便快捷,有助于临床医务人员对中高风险患者早期识别和干预。