机器学习算法在肝细胞癌微血管侵犯术前预测中的应用价值

来源 :中华消化外科杂志 | 被引量 : 0次 | 上传用户:xyc657924564
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的

探讨机器学习算法在肝细胞癌微血管侵犯(MVI)术前预测中的应用价值。

方法

采用回顾性描述性研究方法。收集2015年5月至2018年12月福建医科大学孟超肝胆医院收治的277例肝细胞癌患者的临床病理资料;男235例,女42例;年龄为(56±10)岁,年龄范围为33~80岁。患者术前均行磁共振成像检查。227例肝细胞癌患者通过计算机产生随机数方法以7∶3比例分为训练集193例和验证集84例。应用逻辑回归列线图,支持向量机(SVM)、随机森林(RF)、人工神经网络(ANN)和轻量级梯度提升机(LightGBM)机器学习算法构建MVI术前预测模型。观察指标:(1)训练集及验证集患者临床病理资料分析。(2)影响训练集患者肿瘤MVI危险因素分析。(3)机器学习算法预测模型构建及其术前预测肿瘤MVI准确性比较。正态分布的计量资料以

±s表示,组间比较采用配对t检验。计数资料以绝对数表示,组间比较采用χ2检验。单因素和多因素分析采用Logistic回归模型。

结果

(1)训练集及验证集患者临床病理资料分析:训练集和验证集患者性别(男,女)分别为157、36例和78、6例,两组比较,差异有统计学意义(χ2=6.028,P<0.05)。(2)影响训练集患者肿瘤MVI危险因素分析:训练集193例患者中,MVI阳性108例,MVI阴性85例。单因素分析结果显示:年龄、肿瘤数目、肿瘤直径、卫星病灶、肿瘤边界、甲胎蛋白(AFP)、碱性磷酸酶(ALP)和纤维蛋白原水平是影响肿瘤MVI的相关因素(比值比=0.971,2.449,1.368,4.050,2.956,4.083,2.532,1.996,95%可信区间为0.943~1.000,1.169~5.130,1.180~1.585,1.316~12.465,1.310~6.670,2.214~7.532,1.016~6.311,1.323~3.012,P<0.05)。多因素分析结果显示:AFP>20 μg/L、肿瘤多发、肿瘤直径越大、肿瘤边界不光滑是影响肿瘤MVI的独立危险因素(比值比=3.680,3.100,1.438,3.628,95%可信区间为1.842~7.351,1.334~7.203,1.201~1.721,1.438~9.150, P<0.05),而年龄越大,MVI发生风险越低(比值比=0.958,95%可信区间为0.923~0.994,P<0.05)。(3)机器学习算法预测模型构建及其术前预测肿瘤MVI准确性比较:①应用多因素分析结果筛选指标,包括年龄、AFP、肿瘤数目、肿瘤直径、肿瘤边界,构建逻辑回归列线图,SVM、RF、ANN及LightGBM机器学习算法预测模型,一致性分析结果显示逻辑回归列线图预测模型稳定性较好。逻辑回归列线图、SVM、RF、ANN、LightGBM机器学习算法预测模型训练集和验证集曲线下面积(AUC)分别为0.812、0.794、0.807、0.814、0.810和0.784、0.793、0.783、0.803、0.815,SVM、RF、ANN、LightGBM机器学习算法AUC分别与逻辑回归列线图AUC比较,差异均无统计学意义[(95%可信区间为0.731~0.849,0.744~0.860,0.752~0.867,0.747~ 0.862,Z=0.995,0.245,0.130,0.102,P>0.05)和(95%可信区间为0.690~0.873,0.679~0.865,0.702~0.882,0.715~ 0.891,Z=0.325,0.026,0.744,0.803,P>0.05)]。②应用RF、LightGBM机器学习算法自行筛选临床病理因素指标构建预测模型。根据指标对预测模型重要度排序,选择重要度>0.01的指标,包括年龄、肿瘤直径、AFP、白细胞(WBC)、血小板、总胆红素、天冬氨酸氨基转移酶、γ-谷氨酰转移酶、ALP和纤维蛋白原,构建RF机器学习算法预测模型;挑选重要度>5.0的指标,包括年龄、肿瘤直径、AFP、WBC、ALP和纤维蛋白原,构建LightGBM机器学习算法预测模型;由于ANN及SVM机器学习算法不具备筛选指标能力,应用单因素分析结果筛选指标,包括年龄、肿瘤数目、肿瘤直径、卫星病灶、肿瘤边界、AFP、ALP和纤维蛋白原水平,构建SVM、ANN机器学习算法预测模型。SVM、RF、ANN、LightGBM机器学习算法预测模型训练集和验证集AUC分别为0.803、0.838、0.793、0.847和0.810、0.802、0.802、0.836,分别与逻辑回归列线图AUC比较,差异均无统计学意义[(95%可信区间为0.740~0.857,0.779~0.887,0.729~0.848,0.789~0.895,Z=0.421,0.119,0.689,1.517,P>0.05)和(95%可信区间为0.710~0.888,0.700~0.881,0.701~0.881,0.740~0.908,Z=0.856,0.458,0.532,1.306,P>0.05)]。

结论

机器学习算法可用于术前预测肝细胞癌MVI,但其应用价值尚需多中心大样本数据进一步验证。

其他文献
2002年4月1日国务院颁布了<医疗事故处理条例>,加大了医疗机构及其医务人员的责任,扩大了患者的权利,明确了赔偿费用等,病人的法律意识和自我保护意识也大大加强.2002年4月1
2020年1月14日,湖南省师德养成教育示范项目县(市)区师德师风建设高研班在湖南省中小学教师发展中心举行,来自十四个市州教育局人事科和教师工作科科长、湖南省首批师德养成
深圳市的政府工程“预选承包商”制度开始正式施行,《深圳市政府投资工程预选承包商名录管理规定(试行)》近日颁布生效。此举意味着该市借鉴香港“政府工程牌”的做法,预选出一批
2019年,全省水利建设系统牢牢把握“水利工程补短板、水利行业强监管”的水利工作总基调,全面落实全国水利工程建设工作会议和全省水利工作会议精神,按照厅党组的决策部署,锐
Authorware开发的课件制作模板,是完成课件制作的结构设计、课程内容连续自动播放、暂停、重播、文本解说标志设置、画面与声音、视频的同步控制,具有多种习题类型、自动记分
在研究焊接工艺时,经过理论分析与推导,得到了设计双轴对称焊接H形压弯柱经济截面所应满足的条件,可以直接确定出经济合理的截面尺寸,计算简便,便于应用.
甘露醇能明显降低颅内压,常用于脑卒中患者,但大剂量应用可引起肾损害.我院1996年2月~2002年2月治疗36例脑卒中患者,在急性期应用甘露醇后出现肾损害,现将其临床资料分析报告
2003年1 0月30日,广西来宾市委、市人民政府在来宾市组织召开了<广西来宾创建绿色生态市总体规划(2004-201 5)>评审会.来自国家林业局、自治区林业局、中山大学、广西大学等
随着治疗方式的多元化和多学科联合诊断与治疗的规范化,综合运用经肝动脉插管治疗、放射治疗、靶向治疗等方法使中晚期肝细胞癌实现降期,或通过门静脉栓塞、联合肝脏分隔和门静脉结扎使剩余肝脏快速增生,以及常规行抗病毒和保肝治疗,让不同比例的中晚期或剩余肝脏储备不足的肝细胞癌能够成功转化为可切除肝细胞癌。这将成为提高肝细胞癌诊断水平的重要措施和肝细胞癌临床研究的热点。因此,笔者对肝细胞癌转化治疗的内涵、相应策
在临床试验研究中涉及人体数据的研究时,应该在文中说明所采用的试验程序是否已经通过伦理审查委员会(单位或国家)的评估,并著录其审批文号;如果没有正式的伦理委员会,则应在