基于机器学习对膀胱癌免疫分子亚型和微环境特征的综合分析

来源 :兰州大学 | 被引量 : 0次 | 上传用户:dx3386136
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的:本研究旨在利用机器学习相关原理对膀胱癌的免疫分子亚型及免疫逃逸的潜在分子机制进行研究,并探索亚型与免疫相关特征的相互联系。方法:从癌症基因组图谱(The Cancer Genomic Atlas,TCGA)数据库中下载膀胱癌转录组数据及单核苷酸变异(simple nucleotide variation,SNV)数据,样本包括412个肿瘤及19个癌旁组织,数据提取和后续分析均使用R 4.0.0软件。使用edge R包进行差异表达基因(Differential Expressed Genes,DEGs)分析,通过与从IMMport数据库获取的1830个免疫相关基因进行求交集运算,获得膀胱癌中差异表达的免疫基因。接着,以膀胱癌中差异表达免疫基因的表达谱作为特征变量,使用Consensus Cluster Plus包无监督聚类分析识别膀胱癌免疫分子亚型。通过比较不同亚型的各类临床特征、免疫细胞浸润、检查点基因及人类白细胞抗原(human leukocyte antigen,HLA)基因表达、肿瘤突变负荷(Tumor Mutation Burden,TMB)等,对比了各亚型之间的各种临床和免疫学特征的差异。然后,对各亚型中差异表达的免疫相关基因进行加权基因共表达网络分析(Weighted Gene Coexpression Network Analysis,WGCNA)分为不同基因模块,并对各模块内基因进行京都基因和基因组百科全书(Kyoto Encyclopedia of Genes and Genomes,KEGG)通路富集分析以探索与肿瘤免疫分子亚型及不同亚型转化相关的主要生物学通路。最后,我们使用与免疫分子亚型最相关的模块基因作为变量,通过随机森林原理筛选特征变量和构建决策树模型。并随机选择训练集内30%的样本进行内部验证,以及基因表达综合数据库(Gene Expression Omnibus,GEO)的GSE133624作为外部验证集进行外部验证。结果:对膀胱癌转录组数据的癌与癌旁的差异表达分析得到3203个DEGs,与1830个免疫基因交集运算后筛选得到303个差异表达的免疫基因。以这些基因的表达谱为特征变量,鉴定出4种膀胱癌免疫分子亚型。在四个亚型中,cluster2临床预后较好,免疫细胞、免疫检查点及HLA基因的表达均为最低,即发生免疫逃逸的程度最为严重。对SNV数据的分析显示cluster 2较其他亚型突变频率较高,TMB最高。这些特征均符合免疫治疗应答者的一般特征,提示cluster 2患者的免疫治疗效果较好。而cluster 4各项免疫特征表达较高,与正常膀胱组织的免疫微环境特征相似,发生免疫逃逸程度最轻。接着WGCNA分析将膀胱癌中差异表达的免疫基因分为6个模块,其中棕色基因模块与免疫分子亚型最为相关。KEGG富集分析显示与亚型相关的通路有MAPK、Rap1、Ras、IL-17、Erb B、B细胞受体等,这些通路参与了膀胱癌免疫逃逸及免疫分子亚型的形成。最后,通过随机森林原理筛选棕色模块内的ANXA6,NRP2,TGFB3,GREM1及FGF7五个基因作为特征变量构建决策树模型,其在训练集中准确性为90.5%,内部验证准确性为91.8%。对外部验证集GSE133624的分析显示,预测的各亚型的患者免疫特征与训练集中保持较高一致。这说明模型具有较好的普遍适用性,可准确预测临床膀胱癌测序患者的免疫分子亚型。结论:本研究主要结论如下:1、膀胱癌患者根据差异表达免疫基因可分为4种亚型,不同亚型患者的临床特征不同,其中cluster 2预后较好,cluster 4预后最差。2、四种免疫分子亚型发生了不同程度的免疫逃逸,其中cluster 2发生免疫逃逸程度最为严重,其次为cluster 1,cluster 3,cluster 4。cluster 4亚型的肿瘤微环境免疫特征与正常膀胱组织几乎类似。3、cluster 2亚型患者群体的各项免疫特征符合免疫治疗应答者的特征,提示该亚型可能有较好的免疫治疗效果。4、与膀胱癌免疫分子亚型及免疫逃逸相关的潜在分子通路有MAPK、Rap1、Ras、IL-17、Erb B、B细胞受体等信号通路。5、通过构建决策树模型,可实现对膀胱癌测序患者进行准确的免疫分子亚型分析及免疫治疗的疗效预测。综上,我们探索了膀胱癌的免疫分子亚型及其亚型分化的潜在分子机制,这些结果可能为膀胱癌免疫治疗策略的制定提供指导。
其他文献
目的:内镜下黏膜剥离术(endoscopic submucosal dissection,ESD)已经成为治疗早期胃癌(Early gastric cancer,EGC)的有效手术,但其疗效和并发症上需要进一步明确。本研究的目的旨在评估ESD治疗EGC的疗效和并发症,以及探究ESD治疗早期胃癌的绝对适应症和扩大适应症的疗效差异,为临床提供有益参考。方法:本研究采用回顾性研究方法,纳入从2012.6
目的:本研究通过生物信息学探索膀胱癌发生发展过程中的核心基因、生物标志物及潜在治疗的小分子药物。方法:从TCGA(The Cancer Genome Atlas)数据库下载膀胱癌m RNA表达谱数据及临床数据,并从GEO(Gene Expression Omnibus)数据库下载膀胱癌高通量测序表达谱数据集GSE133624,利用R软件limma包进行差异基因(Differentially exp
目的:目前尚未有对胃癌切除术后胆囊结石形成患者进行风险预测和获益评估的量化工具。本研究旨在分析胃癌切除术后胆囊结石及胆囊炎或(和)胆管炎形成的危险因素,建立胃癌切除术后胆囊结石形成的临床预测模型。同时探讨胃癌切除术中预防性胆囊切除(prophylactic cholecystectomy,PC)在短期和长期内的安全性和有效性。方法:回顾性分析自2013年1月至2017年12月于兰州大学第二医院接受
研究背景:胃癌是全世界常见的消化道恶性肿瘤之一,由于早期胃癌患者无明显全身症状以及缺乏特异性诊断手段,导致早期胃癌诊断困难,患者明确诊断时多为进展期胃癌,往往失去手术机会。阿帕替尼是一种新型的小分子血管内皮生长因子受体抑制剂,对进展期胃癌具有一定疗效,可改善进展期胃癌患者的总体生存率。由奥沙利铂联合替吉奥组成的化疗方案(SOX方案)作为进展期胃癌的传统一线化疗方案在进展期胃癌的综合治疗中占据着重要
目的:研究MTFR2在肝细胞癌(hepatocellular carcinoma HCC)中的临床意义及分子机制。方法:(1)通过The Cancer Genome Atlas(TCGA)数据库分析MTFR2在泛癌中m RNA表达差异及与预后的相关性。(2)通过TCGA和Gene Expression Omnibus database(GEO)分析MTFR2在HCC癌组织和正常组织m RNA表达差
第一部分FAM60A蛋白在结直肠癌中的表达及临床病理意义目的:探讨FAM60A蛋白在结直肠癌中的表达及临床病理意义。方法:采用回顾性研究方法,选取140例在兰州大学第一医院确诊为结直肠癌患者的癌组织,34例癌旁组织,制作成组织芯片。采用免疫组织化学法检测FAM60A蛋白在结直肠癌及癌旁组织中的表达情况,统计学分析FAM60A的表达与结直肠癌患者临床病理特征之间的关系。Kaplan-Meier法进行
背景:三阴性乳腺癌(TNBC)是一种高度侵袭性的乳腺癌,其治疗以手术和化疗为主。而化疗药物与其他药物联合使用是一种趋势,多药联合选择不同作用机制的药物,从而在降低药物的最低有效剂量同时达到更好的临床效果,并且降低药物的毒副作用和耐药性。目的:探究铜绿假单胞菌注射液(PA-MSHA)联合紫杉醇对TNBC细胞的抑制作用及机制。方法:(1)采用CCK8法评价单药PA-MSHA、紫杉醇及两药联合对TNBC
目的:本文主要研究M2型丙酮酸激酶(pyruvate kinase M2,PKM2)和Notch1在人结直肠癌组织标本及体外培养的结直肠癌细胞系RKO和HT29中的表达及其临床意义,以期为结直肠癌的靶向治疗提供新的研究思路。方法:1.收集66例经我院病理活检诊断为结直肠癌的手术标本,通过免疫组化法检测所收集手术标本中PKM2和Notch1在蛋白水平的表达,并分析两者表达水平之间的相关性,以及两者的
目的:通过16S rRNA高通量测序分析胆管癌与胆总管结石患者胆道菌群构成及差异。方法:前瞻性纳入胆管癌和胆总管结石患者,收集患者的临床资料,于ERCP及外科手术中收集患者胆总管胆汁样本,进行DNA提取和16S rRNA测序,分析胆管癌患者与胆总管结石患者胆道菌群构成及差异。结果:本研究最终纳入胆管癌患者15例(肿瘤组)以及胆总管结石患者20例(对照组)。所有样本细菌检出率均为100%,胆管癌患者
研究目的 胰腺癌是临床常见的恶性肿瘤之一。因其早期及部分中期患者未见特异性临床症状,往往发现时已成晚期,难以手术治疗,同时,其化学治疗的疗效常常不佳,故病死率较高。REG基因是Ca2+依赖性凝集素基因家族成员,其编码的蛋白属于小分泌蛋白。REG蛋白在炎症时分泌增多,具有调节细胞生长和凋亡的能力,与各种恶性肿瘤的关系密切。其中,REG3G蛋白具有调控细胞凋亡,调节肿瘤内环境,平衡机体肠道菌群的能力,