机器学习算法和COX列线图在肝细胞癌术后生存预测中的应用价值

来源 :中华消化外科杂志 | 被引量 : 0次 | 上传用户:ai2676886
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的

探讨机器学习算法和COX列线图在肝细胞癌术后生存预测中的应用价值。

方法

采用回顾性描述性研究方法。收集2012年1月至2017年1月中国医学科学院北京协和医学院肿瘤医院收治的375例肝细胞癌行根治性肝切除术患者的临床病理资料;男304例,女71例;中位年龄为57岁,年龄范围为21~79岁。375例患者通过计算机产生随机数方法以8∶2比例分为训练集300例和验证集75例,应用逻辑回归、支持向量机、决策树、随机森林、人工神经网络机器学习算法构建肝细胞癌患者术后生存的预测模型,筛选性能最优的机器学习算法预测模型;构建肝细胞癌患者术后生存预测的COX列线图预测模型;比较最优机器学习算法预测模型和COX列线图预测模型预测肝细胞癌患者术后生存的性能。观察指标:(1)训练集与验证集患者临床病理资料分析。(2)训练集与验证集患者随访及生存情况。(3)机器学习算法预测模型构建及验证。(4)COX列线图预测模型构建及验证。(5)随机森林机器学习算法预测模型与COX列线图预测模型预测性能评价。采用门诊或电话方式进行随访,了解患者生存情况。随访时间截至2019年12月或患者死亡。正态分布的计量资料以

±s表示,组间比较采用配对t检验。偏态分布的计量资料以M(P25,P75)或M(范围)表示,组间比较采用Mann-Whitney U检验。计数资料以绝对数表示,当Tmin≥5,N≥40时,组间比较采用χ2检验;当1≤Tmin≤5,N≥40时,采用校正χ2检验;当Tmin<1或N<40时,采用Fisher确切概率法。采用Kaplan-Meier法计算生存率和绘制生存曲线。采用COX比例风险模型进行单因素分析,将P<0.2的变量纳入Lasso回归分析,根据λ值筛选影响预后的变量,最后将变量纳入COX比例风险模型进行多因素分析。

结果

(1)训练集与验证集患者临床病理资料分析:训练集和验证集患者微血管侵犯(无、有),肝硬化(无、有)分别为292、8例,105、195例和69、6例,37、38例,两组患者比较,差异均有统计学意义(χ2=4.749,5.239,P<0.05)。(2)训练集与验证集患者随访及生存情况:训练集与验证集患者均获得随访。训练集300例患者随访时间为1.1~85.5个月,中位随访时间为50.3个月。验证集75例患者随访时间为1.0~85.7个月,中位随访时间为46.7个月。375例肝细胞癌患者术后1、3年总体生存率分别为91.7%、79.5%。训练集和验证集患者术后1、3年总体生存率分别为92.0%、79.7%和90.7%、81.9%。两组患者术后生存情况比较,差异无统计学意义(χ2=0.113,P>0.05)。(3)机器学习算法预测模型构建及验证。①筛选最优机器学习算法预测模型:根据变量对预测肝细胞癌术后3年生存的信息增益度,应用逻辑回归、支持向量机、决策树、随机森林和人工神经网络5种机器学习算法对肝细胞癌临床病理因素进行变量综合排名。筛选主要预测因素为乙型肝炎e抗原(HBeAg)、手术方式、肿瘤最大直径、围术期输血、肝被膜侵犯、肝脏Ⅳ段侵犯。将预测因素前3、6、9、12、15、18、21、24、27、29个变量依次引入5种机器学习算法。其结果显示:当引入9个变量时,逻辑回归、支持向量机、决策树、随机森林机器学习算法预测模型受试者工作特征曲线的曲线下面积(AUC)趋于稳定。当引入变量>12个时,人工神经网络机器学习算法预测模型AUC波动明显,逻辑回归、支持向量机机器学习算法预测模型AUC稳定性可继续改善,而随机森林机器学习算法预测模型AUC接近0.990,说明随机森林机器学习算法预测模型为最优机器学习算法预测模型。②随机森林机器学习算法预测模型优化和验证:将预测因素29个变量依次引入随机森林机器学习算法预测模型中,构建训练集最佳随机森林机器学习算法预测模型。其结果显示:当引入变量=10个时,网格搜索法示最佳决策树结点个数=4,最佳决策树数目=1 000;当引入变量≥10个时,随机森林机器学习算法预测模型AUC稳定在0.990左右。其中当引入变量=10个时,随机森林机器学习算法预测模型预测训练集术后3年总体生存AUC为0.992,灵敏度为0.629,特异度为0.996,预测验证集术后3年总体生存AUC为0.723,灵敏度为0.177,特异度为0.948。(4)COX列线图预测模型构建及验证。①训练集患者术后生存因素分析。单因素分析结果显示:HBeAg、甲胎蛋白、围术期输血、肿瘤最大直径、肝被膜侵犯、肿瘤分化程度是影响肝细胞癌患者术后生存的相关因素(风险比=1.958,1.878,2.170,1.188,2.052,0.222,95%可信区间为1.185~3.235,1.147~3.076,1.389~3.393,1.092~1.291,1.240~3.395,0.070~0.703,P<0.05)。将P<0.2的临床病理因素纳入Lasso回归分析,其结果显示:性别,HBeAg,甲胎蛋白,手术方式,围术期输血,肿瘤最大直径,肿瘤位置在肝脏Ⅴ段和肝脏Ⅷ段,肝被膜侵犯,肿瘤分化程度(高分化、中高分化、中分化、中低分化)是影响肝细胞癌患者术后生存的相关因素。进一步将上述临床病理因素纳入多因素COX回归分析,其结果显示:HBeAg、手术方式、肿瘤最大直径是肝细胞癌患者术后生存的独立影响因素(风险比=1.770,8.799,1.142,95%可信区间为1.049~2.987,1.203~64.342,1.051~1.242,P<0.05)。②COX列线图预测模型的构建和验证:将训练集COX多因素分析结果中P≤0.1的临床病理因素引入Rstudio软件及其rms软件包,构建训练集COX列线图预测模型。COX列线图预测模型预测术后总体生存的C-index为0.723(se=0.028),预测训练集术后3年总体生存AUC为0.760,预测验证集术后3年总体生存AUC为0.795。训练集校准图验证显示COX列线图预测模型对术后生存有较好预测效果。COX列线图回归函数=0.627 06×HBeAg(正常=0,异常=1)+0.134 34×肿瘤最大直径(cm)+2.107 58×手术方式(腹腔镜=0,开腹手术=1)+0.545 58×围术期输血(无输血=0,输血=1)-1.421 33×高分化(非高分化=0,高分化=1)。计算所有患者COX列线图风险评分,应用Xtile软件寻找COX列线图风险评分最佳阈值,风险评分≥2.9分为高危组,风险评分<2.9分为低危组。Kaplan-Meier总体生存曲线结果显示:训练集低危组和高危组患者术后总体生存比较,差异有统计学意义(χ2=33.065,P<0.05)。验证集低危组和高危组患者术后总体生存比较,差异有统计学意义(χ2=6.585,P<0.05)。进一步采用决策曲线分析结果显示:联合HBeAg、手术方式、围术期输血、肿瘤最大直径和肿瘤分化程度因素的COX列线图预测模型预测性能优于单一因素的预测性能。(5)随机森林机器学习算法预测模型和COX列线图预测模型预测性能评价:通过对2种模型中共同含有的重要变量(肿瘤最大直径)进行分析,并将2种模型通过预测误差曲线进行比较,观察2种模型的预测差异。其结果显示:肿瘤最大直径为2.2 cm时,随机森林机器学习算法和COX列线图预测模型预测患者术后3年生存率分别为77.17%和74.77%(χ2=0.182,P>0.05);肿瘤最大直径为6.3 cm时,随机森林机器学习算法和COX列线图预测模型预测患者术后3年生存率分别为57.51%和61.65%(χ2=0.394,P>0.05);肿瘤最大直径为14.2 cm时,随机森林机器学习算法和COX列线图预测模型预测患者术后3年生存率分别为51.03%和27.52%(χ2=12.762,P<0.05)。随着肿瘤最大直径增加,2种模型预测患者生存率差异增大。验证集中,随机森林机器学习算法预测模型预测患者术后3年总体生存AUC为0.723,COX列线图预测模型预测患者术后3年总体生存AUC为0.795,两者比较,差异有统计学意义(t=3.353,P<0.05)。采用Bootstrap交叉验证结果显示:随机森林机器学习算法预测模型和COX列线图预测模型预测3年生存的整合Brier得分分别为0.139、0.134,COX列线图预测模型预测误差低于随机森林机器学习算法预测模型。

结论

与机器学习算法预测模型比较,COX列线图预测模型预测肝细胞癌术后3年生存性能更佳,且其变量少,易于临床使用。

其他文献
目的探讨改良垂直瘢痕法乳房成形术(Hall-Findlay法)的临床效果。方法2009年5月至2018年5月,南方医科大学南方医院整形科共完成128例女性乳房成形术,年龄22~49岁,平均38.3岁。其中巨乳缩小56例,单纯乳房悬吊72例。按Hall-Findlay法设计手术切口,剥离乳腺组织保留上部或内侧蒂;按水平横隔解剖结构去除部分肥大的下部及基底乳腺组织。对乳房肥大明显患者术中联合抽吸脂肪,
目的探讨菱形皮瓣(Limberg皮瓣)转移修复与直接缝合治疗藏毛窦的临床效果。方法2013年1月至2017年12月,解放军总医院第六医学中心烧伤整形科及普通外科收治76例,男69例,女7例;年龄16~40岁,平均22岁。用Limberg皮瓣转移修复与直接缝合两种手术方法,其中37例为菱形切除后Limberg皮瓣转移;39例为直接缝合术。术后随访1~2年,分别就患者手术时间、住院时间、并发症、复发率
比较应用射频微针与小切口皮下修剪技术治疗臭汗症的效果。2016年3月至2017年6月,选取杭州市余杭区第一人民医院手外整形科臭汗症患者62例(男26例,女36例,年龄14~38岁,平均23岁);分射频组及小切口组,各31例,参照Young-Jin Park疗效评定标准,进行治疗结果评价,术后随访2~3年。射频组31例中优19例,良11例,优良率96.8%;其中差1例为14岁男性患儿,术前臭汗症为3
目的探讨布比卡因肿胀液在全身麻醉吸脂术安全性及有效性。方法2015年3月至2017年12月,收集女性吸脂患者149例资料,年龄18~63岁,平均28.9岁。在全身麻醉结合含布比卡因局部麻醉肿胀液作用下完成不同部位吸脂术。结果布比卡因使用量1.14~1.87 mg/kg未显示明显毒性,布比卡因联合利多卡因组在所试各种吸脂量范围未显示不良反应。布比卡因组及其布比卡因联合利多卡因组肿胀液镇痛效果优于利多
随着脂肪移植技术的不断成熟,为提高脂肪移植后脂肪细胞的成活率或保留率以获得更好的效果,国内外均有将来源自体的富血小板血浆联合自体脂肪进行移植的报道。因两者混合比例不同、移植部位及技术差异、富血小板血浆浓度及激活程度等多因素导致富血小板血浆联合自体脂肪移植后得到的效果不一,多数学者认为富血小板血浆对自体脂肪移植是有利的。
鲜红斑痣是一种常见的先天性皮肤血管性疾病,痊愈率较低。一些无创检测技术可预判疗效和提高治疗效果,如皮肤镜、反射式共聚焦显微镜、高频超声、反射分光光度计、三色色度计、光学相干断层扫描、激光多普勒血流测量等。概述常用无创检测技术在鲜红斑痣预判疗效和制定治疗方案中的应用。
目的探讨磁共振成像(MRI)术前检测男性乳房发育的指导意义,寻求适合男性乳房发育患者的手术方法。方法2016年11月至2018年8月,空军军医大学西京医院全军整形外科研究所对38例男性乳房发育患者(年龄18~35岁,平均23岁)术前进行MRI检查,判断患者乳房发育类型,个性化设计手术方案。结果38例患者手术均一期愈合,乳头乳晕感觉良好;无血肿、血清肿、皮肤坏死等并发症。胸部体积明显减小,外形较术前
目的评估直线法乳房成形术(Lejours法)修复乳房下垂的手术效果。方法2014年7月至2018年7月,广东省第二人民医院医院整形外科收治36例乳房下垂矫正失败女性患者,年龄25~42岁,平均32.1岁。按直线法乳房成形术进行修复,根据术前设计去除蒂部表皮,切除多余的皮肤移除假体及包膜,向上移动乳腺瓣固定于胸大肌筋膜,固定乳头、乳晕后逐层缝合。结果36例患者乳房外形均得到改善,切口瘢痕较小,且随时
肝细胞癌的发病率及病死率居高不下。我国肝细胞癌患者常同时伴有病毒性肝炎甚至肝硬化,术前肝功能及肝脏储备功能不佳,因此,对手术方式及切除范围有较高要求。解剖性肝切除术是目前治疗肝细胞癌的有效方法,有利于患者的远期疗效。解剖性肝切除术不同于规则性肝切除术,其可以在完整切除癌灶的同时最大限度地保留肝实质,理论上是肝细胞癌的最佳手术治疗方案。随着腹腔镜肝切除术的发展与进步,实现了腹腔镜解剖性肝段切除,但判
以免疫检查点抑制剂(ICIs)为代表的免疫治疗掀起肿瘤治疗的革命,多种ICIs治疗肝细胞癌的早期临床研究数据显示其良好的应用前景,迎来了肝细胞癌的免疫治疗时代。近来一项ICIs联合抗血管生成治疗的Ⅲ期临床研究结果显示其疗效和安全性优于标准治疗,有望成为肝细胞癌新的一线标准治疗。目前ICIs联合放化疗、抗血管生成治疗及局部治疗的研究正在全世界开展,将进一步刷新肝细胞癌系统治疗的格局。