论文部分内容阅读
目的:胶质瘤是目前人们生活中一种常见的多发的肿瘤疾病。作为一种恶性肿瘤,严重影响人们的生活质量和日常的工作。虽然基于单个基因的研究已经有所报道,但是对于基因间的互作及基因功能的富集分析的研究目前还很少。因此本文提出基于基因芯片对胶质瘤的研究。本实验采用芯片分析技术和文本挖掘技术对胶质瘤进行生物信息学分析,筛选差异表达基因、差异共表达基因及及差异共表达关系对,构建分子差异调控网络、蛋白质互作网络、生物学通路间的交互网络,并进行功能富集,以阐明胶质瘤的发生发展作用机制,为胶质瘤的诊断治疗奠定理论基础。方法:从GEO数据库下载芯片数据GSE4290,选取其中77例胶质瘤样本和23例正常对照样本进行后续生物信息学分析分析。使用R软件limma包中的T_test法计算差异表达基因(DEGs),选取P-value<0.05及|logFC|>2为显著性阈值,筛选差异表达基因。使用DAVID在线工具对差异表达基因进行GO功能注释;使用cytoscape软件构建蛋白质与蛋白质相互作用(PPI)网络;Cytoscape的插件ClusterONE进行模块划分,并随后进行显著的模块进行功能富集分析。使用R软件中的Affy包和limma包筛选差异表达基因,选择阀值|logFC|>0.6且Pvalue<0.05,再使用R软件DCGL包中的DCe、DCp和DCsum函数,选择阀值q<0.25作为差异共表达基因(Differential Coexpression Gene,DCG)和差异共表达关系(Differentially Co-expressed Link,DCL)的筛选条件。DAVID在线工具对差异共表达基因(DCGs)进行KEGG pathway显著性富集分析。用Cytoscape构建差异共表达基因的转录调控网路,随后使用Cytoscape插件ClusterONE对其进行模块分析,选取最显著的前5个模块进行功能富集分析。基于自然语言处理法进行文本挖掘分析,然后在人与小鼠的基因同源性数据MGD的基础上,挖掘与胶质瘤相关的突变基因。利用cytoscape软件进行分子相关关系网络的构建。采用DAVID在线工具进行KEGGpathway和GO功能富集分析。结果:1.共筛选到548个差异表达基因,包括441个下调基因和107个上调基因。PPI网络中共包含1305个节点和1604条边。选取最显著的前5个子模块进行子网络模块分析,这5个子模块的中心节点基因依次为:FN1、GNAO1、STX1A、CDK1、CHGB。子模块的GO富集结果主要为:extracellular region part,vesicle-mediated transport, cell cycle process, nucleoplasm等。KEGG pathway富集结果主要是:ECM-receptor interaction, long-term depression, SNARE interactions invesicular, cell cycle等。2.共筛选到999个差异共表达基因(DCGs)和1833200对差异共表达关系。差异共表达调控网络共包含1441节点和2127条边。前5个子模块的节点基因分别为:模块1:STAT1、STAT3、STAT4、PLAU;模块2:EPAS1;模块3:BPTF;模块4:CBFB、NFYB;模块5:EGR3。差异共表达模块的GO估计主要结果为:enzyme binding, protein modification by small protein conjugation or removal,muscle cell differentiation, mitotic cell cycle, pore complex等。3.共筛选到52518个人类分子互作关系对,其中人与老鼠同源的分子关系对为27526个。此外,筛选到9个与胶质瘤相关的突变基因。胶质瘤相关基因的互作网络中共包含875个节点和1068条边,其中连接度最高的基因为:TP53、CDKN2A、PTEN、NF1、TG等。显著富集的KEGG pathway为:p53signalingpathway, pathways in cancer, cell cycle等。显著富集的GO功能为:nucleoplasmand regulation of cell death等。结论:通过筛选差异表达基因和共表达基因,构建PPI网络和转录调控网络,随后进行功能富集分析;此外,结合文本挖掘技术筛选胶质瘤相关的突变基因,构建胶质瘤相关分子的互作网络,并进行功能富集分析;筛选到与胶质瘤显著相关的差异表达基因、差异共表达基因、突变基因及通路,为进一步深入研究胶质瘤的发病机制提供有力的依据,为今后胶质瘤的基因治疗探明药物作用靶点。