基于生物信息学的胶质母细胞瘤不良预后风险评估

来源 :中国医科大学 | 被引量 : 0次 | 上传用户:bianmlu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的:胶质母细胞瘤(GBM)是一种高度恶化的弥漫性神经胶质瘤,具有极强的浸润性。GBM的主要治疗方法为手术切除联合放化疗,但术后易复发,且预后不良,其中位生存期仅有14个月左右。因此,本文基于生物信息学分析,寻找与GBM不良预后相关的分子标志物,将有助于筛选可靠生物分子标志物,并对其进行风险评估,并具有关键意义。方法:从癌症基因组图谱(TCGA)中下载GBM相关数据集,利用R语言进行差异基因分析,FDR<0.05,fold change>1,并绘制相关火山图和热图。以P<0.05作为显著性检验判别标准,对差异基因进行生存分析。利用DAVID8.4对影响总生存率的差异基因进行基因本体论(GO)和京都基因组百科全书(KEGG)富集分析,探究相关靶基因参与的生物过程、细胞组成、分子功能和信号通路;利用String数据库获取对总生存有影响的差异基因的蛋白-蛋白相互作用网络,联合Cytoscape软件中MCODE插件对前述基因进行模块分析。然后,利用Cytoscape中ClueGO插件将与GBM相关的基因簇进行GO和KEGG基因富集分析,观察通路之间的关系和基因在通路中的富集情况。同时,对该基因簇及其临床资料进行Cox单因素回归分析,将可能影响患者生存期的变量纳入到Cox多变量回归分析中。根据风险评分中位数将患者分为高风险组和低风险组进行预后生存分析,并检验模型的灵敏度和特异性。结果:1、本研究从TCGA中下载的数据包括5例正常组织和156例GBM组织样本。通过差异分析得到6690个基因,其中上调基因为3460个和下调基因为3230个。2、对差异表达的6690个基因进行预后分析,得到对预后有影响的323个上调基因和177个下调基因。GO注释显示靶基因参与的生物过程主要集中在细胞外基质组织、整合素介导的信号通路等;靶基因参与的细胞组成主要有胶原三聚体、粘着斑等,靶基因参与的分子功能有胶原结合、整联蛋白结合等。KEGG富集分析显示靶基因参与ECM-受体相互作用、粘着斑等信号通路。3、利用String数据库和Cytoscape软件对差异表达的500个基因进行蛋白-蛋白相互作用网络可视化分析后,并通过特定条件筛选,得出与GBM的发生、发展生物学进程与信号通路密切相关的涵盖25个基因的基因簇。4、对基因簇所包含的基因进行Cox单因素回归分析得出23个具有显著预后的基因。对上述基因进行Cox多因素回归分析,得出涵盖8个基因的线性预测模型。风险评分=0.373×ExpRCN1+0.349×ExpFN1+0.523×ExpLAMB1-0.727×ExpLAMC1+0.747×ExpITGB8-0.448×ExpTNC+0.227×ExpHSPG2+0.325×ExpITGB5。5、根据中位风险评分,将156位GBM患者分为高风险组(n=78)和低风险组(n=78)进行预后分析,结果显示高风险组预后不良。ROC曲线面积AUC=0.822,表明8基因模型对GBM患者的预后具有良好的灵敏度和特异性。结论:1、CKAP4、COL1A1、COL5A1、COL6A1、COL6A2、COL6A3、DMP1、FAM20C、FN1、HSPG2、IGFBP1、ITGA1、ITGA3、ITGA5、ITGB5、ITGB8、LAMA4、LAMB1、LAMC1、MXRA8、PTK2、PXN、RCN1、SCG3、TNC基因簇参与胶原分解代谢、整联素所介导的信号通路、细胞外基质结构和组织、基底层、血小板衍生生长因子结合、粘着斑等GBM发生、发展生物学相关进程与信号通路。2、筛选得到RCN1、FN1、LAMB1、LAMC1、ITGB8、TNC、HSPG2、ITGB5可以作为GBM患者预后的联合标志物,相对于单个独立预后因子具有良好的灵敏度和特异性。
其他文献
目的:越来越多的证据支持长链非编码RNA ZFAS1(LncRNA ZFAS1)可作为蛋白调节剂介导多种癌症的发生发展,然而其在结直肠癌中的生物学功能与分子调控机制尚不完全清楚,因此,挖
目的:探究金雀异黄素(genistein,GEN)对脂多糖(lipopolysaccharides,LPS)活化的巨噬细胞凋亡的影响及是否与调节TIPE2/Akt通路有关。方法:1.将1 000 ng·mL-1LPS作用于RAW264.7细
随着数据信息化的日益发展,人工地从数据中筛选出需求的信息已经变得十分困难,为此研究者以统计学思想为基础提出了机器学习方法,而其中分类、聚类和回归分析等知识发现方法更是获得了较为广泛的应用。但原始数据中可能存在的冗余及偏差信息会导致知识发现算法难以获得预期的结果,因此预先对数据进行必要的处理在机器学习领域的研究中同样十分重要。以属性选择算法为代表的数据预处理技术被提出用来从从原始数据中提取出更加重要
背景和目的药物的靶向治疗是近些年来研究的热点,索拉菲尼作为一种口服多重激酶抑制药,具有抑制肿瘤细胞增殖和血管形成的双重作用,作为治疗肝癌和转移性肾细胞癌的一线药物,
随着人类基因组计划测序工作完成,蛋白质的相关研究已成为当今生命科学的主要研究内容之一。配体结合蛋白在诸多生物过程中发挥关键作用。蛋白质-配体结合残基的识别对于理解蛋白质功能有重要意义。由于传统测定方法的技术细节复杂且成本高昂,处理海量的蛋白质需要计算方法的参与。已知的计算方法均基于传统机器学习,可被粗略地分为基于序列的方法和基于三维结构的方法,两者的根本区别在于是否使用三维结构,前者已在一系列结合
机器学习试图使用图结构化数据作为特征信息进行预测或发现新的模式,其研究重点主要集中在嵌入图中的离散节点进入具有某些所需几何特性的连续空间。尽管图表示学习潜力巨大,但将图嵌入到低维空间并不是一项简单的任务。本文的工作重点是赋予神经网络表示适当的几何结构,以捕获图数据的基本属性,特别是层次结构和聚集行为。而复杂网络中的异质和高聚集拓扑特性却令人惊讶的反映在双曲负曲率空间的基本属性中。因此,本文的目的是
植物的生活与微生物息息相关并且能和多种微生物建立共生关系。这些共生微生物能够影响宿主植物的生长、代谢、抗胁迫等能力,因此这些共生微生物菌剂在可持续农业发展上显示
在移动互联网飞速发展的驱动下,移动终端上网、机器连接等产生的移动数据业务量快速增长,多样化的移动通信场景不断涌现。为应对数据的快速增长以及对多样化业务场景的支持,
随着下一代基因测序技术的发展,生物学领域产生了大量的数据,对这些生物数据的处理是一个急需解决的问题,同时也是计算机,数学等其他多个领域面临的一个重大挑战,生物信息学在这个背景下产生了。DNA序列之间的比对是生物信息学研究问题之一,并在很多方面有着重要的应用。序列比对旨在发现两条DNA序列之间的相似程度,进而揭示对应物种之间的联系。过去50年里,大量的序列比对方法被提出,目前主要的序列比对方法包括两
面对大数据的环境,如何从杂乱无章的海量信息中给用户准确推荐有价值的信息,这将是推荐系统领域的主要研究任务。在传统的推荐算法中,评分数据的稀疏性是影响传统推荐算法推荐准确率的主要因素,虽然有些传统方法解决了评分数据稀疏性问题,但仅仅挖掘评分数据间的线性关系,而且未考虑到用户兴趣波动的问题。针对评分数据稀疏性和用户兴趣波动问题,本文提出了一种集成神经网络的Top-N推荐模型(CDAETN),从海量数据