论文部分内容阅读
第一部分:基于血小板-炎症因子和机器学习预测肺腺癌术后患者的预后目的:目前,人工智能特别是机器学习,已经有很多研究表明它在医学上的应用,有着巨大的潜力和极高的临床价值。机器学习算法结合医学,可能会为肺癌患者提供新的临床效益和研究价值。但是,少有研究关注在麻醉与围术期医学期间,机器学习技术和血小板与肺腺癌之间的关系。本研究主要通过机器学习算法,探索血小板-炎症特征与肺腺癌预后的关系,并构建超长住院天数、术后总生存以及术后复发的预测模型。方法:我们收集术前检验指标以及临床变量指标,并通过11种机器学习算法构建肺腺癌超长住院天数、术后总生存以及术后复发的预测模型。我们也采用GBM算法和gbdt算法从高到低展示前15个影响超长住院天数、术后总生存以及术后复发的变量。同时,我们也采用相关性分析展示这15个变量分别与超长住院天数、术后总生存和术后复发之间的关系。关于模型评估方面,我们采用准确率、精确度、ROC曲线等评估模型的预测性能。模型按7:3比例随机分为训练组和测试组,并进行5折交叉验证。最后,我们采用相关变量构建肺腺癌术后总生存和术后复发的人工智能算法的在线网页工具。结果:各个变量与预后相关性排名分析的结果:gbm算法显示年龄、NLR、尿量、嗜中性粒细胞和PLR是影响超长住院天数的前五个主要影响因素;gbm算法显示肿瘤分期、胸腔镜、麻醉时间、抽烟、年龄和血小板计数是影响肺腺癌术后的总生存的前六个主要影响因素,gbm显示胸腔镜、嗜中性粒细胞、尿量、血小板宽度和LMR是影响肺腺癌的术后复发的前五个主要影响因素。11种机器学习在预测肺腺癌患者的超长住院天数的测试组结果:就曲线下面积(AUC)而言,除了Logistic Regression和SVC之外,所有机器学习分类器的AUC值均小于0.600;在准确率中,除gnb算法外,其他机器学习分类器的准确率均高于84%。11种机器学习在预测肺腺癌患者的术后总生存的测试组结果:就曲线下面积(AUC)而言,除了adab之外,所有机器学习分类器的AUC值均小于0.760;在准确率中,除gnb算法外,其他机器学习分类器的准确率均高于90%。11种机器学习在预测术后复发的测试组结果:就曲线下面积(AUC)而言,除了Logistic Regression、Gradient Boosting、SVC、MLPC和adab之外,所有机器学习分类器的AUC值均小于0.600;在准确率中,除gnb算法外,其他机器学习分类器的准确率均高于90%。最后,我们基于人工智能算法预测肺腺癌术后总生存和术后复发的在线网页工具(https://share.streamlit.io/zhouchengmao/streamlit_app_gnb_adab_os_re/st_app_gn b_adab_os_re.py)。结论:我们的研究结果表明,基于血小板-炎症因子特征和机器学习能够有效建立的肺腺癌患者的超长住院天数、术后总生存以及术后复发的预测模型。这11种机器学习算法的综合表现而言,Logistic Regression机器学习算法最适合用于预测肺腺癌患者的超长住院天数,而gnb和adab两种机器学习算法在预测肺腺癌患者的术后总生存以及术后复发中表现最佳。而且,我们的结果表明,血小板-炎症因子是影响肺腺癌患者预后的主要因素之一。第二部分:基于机器学习以及多组学筛选诊断肺腺癌患者的血小板相关基因/蛋白目的:本研究旨在通过机器学习和多组学研究,筛选出能够区分或诊断肺腺癌的血小板相关基因和I期肺腺癌的血小板相关蛋白,从而为麻醉与围术期医学期的肺腺癌患者提供及时的治疗或干预措施,并能够为机器学习如何结合血小板相关变量有效帮助提高肺腺癌患者的诊断提供了一定的研究思路。方法:我们通过机器学习算法筛选出差异表达的血小板相关基因和蛋白后,再采用机器学习算法做权重分析。接着,我们再进行GO和KEGG富集分析。然后,我们从体外细胞实验以及其它角度验证这些血小板相关基因的表达情况。结果:关于血小板相关基因分析研究方面:与正常组织相比,我们在肺腺癌和癌旁组织中识别了99个血小板相关差异表达的基因,包括43个上调的基因和56个下调的基因;经过ROC曲线和机器学习算法gbm的共同筛选,得出两者的共同血小板相关差异基因,共有5个,分别为:PECAM1、CLEC3B、WNT3A、CD36和GAS6;这5个诊断基因的AUC值都大于0.950。我们的本院的组织标本的测序数据和体外细胞实验结果也表明,这5个基因在两组中的表达明显有差异,其差异明显有统计学差异(P<0.05)。关于血小板相关蛋白分析研究方面:我们采用机器学习gbm算法对这8个血小板相关差异蛋白与I期肺癌的关系进行分析,并展示了前8个最能够诊断I期肺腺癌的血小板相关差异基因。经过ROC曲线和机器学习算法gbm的共同筛选,得出两者的共同血小板相关差异蛋白,共有2个,分别为:Apolipoprotein A-II和BCHE。这2个诊断蛋白的AUC值均大于0.800。结论:我们的研究结果表明,基于机器学习以及肺腺癌的组织样本的转录组学可筛选出诊断肺腺癌患者的血小板相关基因,分别为PECAM1、CLEC3B、WNT3A、CD36和GAS6,准确率高达96.13%;同样,机器学习以及血液样本的蛋白组学可筛选出诊断I期肺腺癌患者的血小板相关蛋白;分别为Apolipoprotein A-II和BCHE,准确率高达85.00%。第三部分基于多组学中血小板相关因子与机器学习构建肺腺癌患者的预后模型与验证目的:本研究旨在通过机器学习和多组学研究,能够筛选出与肺腺癌预后的血小板相关基因或蛋白,进而构建血小板相关基因/蛋白的风险评分,从而为麻醉与围术期医学期的患者提供及时的治疗或干预提供目标,并进一步探讨其与免疫的相关性以及其他相关的机制研究。方法:我们通过TCGA数据库、TCPA数据库和本院组织样本测序数据综合分析血小板相关蛋白或基因。通过机器学习算法筛选出差异表达的血小板相关蛋白和基因。然后通过机器学习算法和单多数COX风险模型构建血小板相关基因或蛋白风险评分。从多个角度验证模型的有效性和其与免疫反应之间的关系以及其潜在的相关机制。最后,在体外实验验证血小板相关基因P2RX1和TUBA4A对肺腺癌细胞A549的生物学行为影响。结果:关于蛋白组学与肺腺癌预后方面:通过单多因素COX风险回归分析和机器学习算法,筛出3个最终与总生存相关的血小板相关蛋白(CD49B、Fibronectin和FOXM1),并构建血小板相关蛋白风险评分。ROC曲线和机器学习gbm算法的权重排序分析结果表明,血小板相关蛋白风险评分预测总生存的性能与肿瘤分期媲美。血小板相关蛋白风险评分的高低风险组中免疫细胞浸润水平的差异结果为,两组中B cells memory和Dendritic cells activated表达有差异。同时,在这3个血小板相关蛋白中,FOXM1是核心蛋白。关于转录组学与肺腺癌预后方面:通过单多因素COX风险回归分析和机器学习算法,筛出8个最终与总生存相关的血小板相关基因(P2RX1、TUBA4A、CLEC3B、HYAL1、COL5A1、TIMP1、CCNA2和ENTPD2),并构建血小板相关基因风险评分。ROC和机器学习gbm算法的结果,表明血小板相关基因风险评分预测总生存的性能与肿瘤分期媲美。然后,我们基于streamlit的app构建了肺腺癌总生存和无进展生存期的在线网页工具(https://share.streamlit.io/zhouchengmao/streamlit_app_lgbm_os_pfi/st_app_lgbm_os_pfi.py),主要原理涉及LGBM算法。而且,我们的结果表明,血小板相关基因风险评分与免疫反应有密切关联:两组中Plasma cells和Macrophages M0等免疫浸润细胞有明显差异;两组中的BTLA和CD276等免疫检查点有着明显差异;而且两组的APC co inhibition和MHC class I等免疫功能有着明显差异;两组的Dysfunction、Exclusion和TIDE等免疫功能有着明显差异。另外,关于血小板受体相关基因对肺腺癌细胞影响的体外相关验证实验方面:P2RX1和TUBA4A基因的敲减,可以改变肺腺癌细胞A549细胞的增殖能力、侵袭能力和迁移能力,其可能相关的机制分别与JAK-STAT和P53信号通路的改变相关,并且,P2RX1能影响巨噬细胞的浸润能力。结论:我们的研究结果表明,基于多组学中血小板相关蛋白或基因与机器学习算法能够有效构建肺腺癌患者的预后模型,该模型影响肺腺癌预后的相关机制可能与免疫反应有着密切关联。体外细胞实验结果表明,P2RX1和TUBA4A基因的敲减,可以改变肺腺癌细胞A549细胞的增殖能力、侵袭能力和迁移能力,差异有统计学意义(P<0.05);而且,P2RX1的敲减可以促进巨噬细胞对肺腺癌细胞的浸润能力。