基于芯片数据和文本挖掘的胶质瘤生物信息学分析

来源 :吉林大学 | 被引量 : 0次 | 上传用户:ZHUTINGFNEG12
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的:胶质瘤是目前人们生活中一种常见的多发的肿瘤疾病。作为一种恶性肿瘤,严重影响人们的生活质量和日常的工作。虽然基于单个基因的研究已经有所报道,但是对于基因间的互作及基因功能的富集分析的研究目前还很少。因此本文提出基于基因芯片对胶质瘤的研究。本实验采用芯片分析技术和文本挖掘技术对胶质瘤进行生物信息学分析,筛选差异表达基因、差异共表达基因及及差异共表达关系对,构建分子差异调控网络、蛋白质互作网络、生物学通路间的交互网络,并进行功能富集,以阐明胶质瘤的发生发展作用机制,为胶质瘤的诊断治疗奠定理论基础。方法:从GEO数据库下载芯片数据GSE4290,选取其中77例胶质瘤样本和23例正常对照样本进行后续生物信息学分析分析。使用R软件limma包中的T_test法计算差异表达基因(DEGs),选取P-value<0.05及|logFC|>2为显著性阈值,筛选差异表达基因。使用DAVID在线工具对差异表达基因进行GO功能注释;使用cytoscape软件构建蛋白质与蛋白质相互作用(PPI)网络;Cytoscape的插件ClusterONE进行模块划分,并随后进行显著的模块进行功能富集分析。使用R软件中的Affy包和limma包筛选差异表达基因,选择阀值|logFC|>0.6且Pvalue<0.05,再使用R软件DCGL包中的DCe、DCp和DCsum函数,选择阀值q<0.25作为差异共表达基因(Differential Coexpression Gene,DCG)和差异共表达关系(Differentially Co-expressed Link,DCL)的筛选条件。DAVID在线工具对差异共表达基因(DCGs)进行KEGG pathway显著性富集分析。用Cytoscape构建差异共表达基因的转录调控网路,随后使用Cytoscape插件ClusterONE对其进行模块分析,选取最显著的前5个模块进行功能富集分析。基于自然语言处理法进行文本挖掘分析,然后在人与小鼠的基因同源性数据MGD的基础上,挖掘与胶质瘤相关的突变基因。利用cytoscape软件进行分子相关关系网络的构建。采用DAVID在线工具进行KEGGpathway和GO功能富集分析。结果:1.共筛选到548个差异表达基因,包括441个下调基因和107个上调基因。PPI网络中共包含1305个节点和1604条边。选取最显著的前5个子模块进行子网络模块分析,这5个子模块的中心节点基因依次为:FN1、GNAO1、STX1A、CDK1、CHGB。子模块的GO富集结果主要为:extracellular region part,vesicle-mediated transport, cell cycle process, nucleoplasm等。KEGG pathway富集结果主要是:ECM-receptor interaction, long-term depression, SNARE interactions invesicular, cell cycle等。2.共筛选到999个差异共表达基因(DCGs)和1833200对差异共表达关系。差异共表达调控网络共包含1441节点和2127条边。前5个子模块的节点基因分别为:模块1:STAT1、STAT3、STAT4、PLAU;模块2:EPAS1;模块3:BPTF;模块4:CBFB、NFYB;模块5:EGR3。差异共表达模块的GO估计主要结果为:enzyme binding, protein modification by small protein conjugation or removal,muscle cell differentiation, mitotic cell cycle, pore complex等。3.共筛选到52518个人类分子互作关系对,其中人与老鼠同源的分子关系对为27526个。此外,筛选到9个与胶质瘤相关的突变基因。胶质瘤相关基因的互作网络中共包含875个节点和1068条边,其中连接度最高的基因为:TP53、CDKN2A、PTEN、NF1、TG等。显著富集的KEGG pathway为:p53signalingpathway, pathways in cancer, cell cycle等。显著富集的GO功能为:nucleoplasmand regulation of cell death等。结论:通过筛选差异表达基因和共表达基因,构建PPI网络和转录调控网络,随后进行功能富集分析;此外,结合文本挖掘技术筛选胶质瘤相关的突变基因,构建胶质瘤相关分子的互作网络,并进行功能富集分析;筛选到与胶质瘤显著相关的差异表达基因、差异共表达基因、突变基因及通路,为进一步深入研究胶质瘤的发病机制提供有力的依据,为今后胶质瘤的基因治疗探明药物作用靶点。
其他文献
1994年以来,对吉林省黄牛“猝死症”的病因进行了多方面的研究,包括细菌学检验、病毒学检验、人工感染试验、毒物检验、牛毛硒元素分析及病尸病理形态学观察。结果表明,A型魏氏梭菌是
<正>~~
期刊
尾矿库的排洪系统是通过调洪计算确定的,尾矿库调洪计算有其自身的特点.本文结合尾矿库调洪计算的特点及工程实例,认为对尾矿库调洪计算设定限制条件是必要的,但只有合理地确
目的探究白芍总苷(total glucosides of paeony,TGP)对维持性血液透析患者(maintenance hemodialysis,MHD)炎症因子和血清中性粒细胞明胶酶相关载脂蛋白(NGAL)、Toll受体4(TL
<正> 黄河入海是相当苍凉悲壮,李白的“黄河之水天上来,奔流到海不复回。”千古绝唱;唱得中国人为之慷慨激昂。长江入海是那么豪迈激越,刘禹锡的“八月涛声吼地来,头高数丈触
以人绒毛膜促性腺激素为抗原,对BALB/c小鼠一次脾内直接注射免疫,免疫后6d,取其血清进行抗体检测,结果12800倍稀释度仍呈阳性,取此免疫小鼠脾细胞与同系小鼠骨髓瘤细胞NS-1进行细胞融合,融合后,将经检
目的探讨狼疮肾炎(lupus nephritis,LN)患者自噬水平及其对足细胞相关蛋白表达水平的影响。方法选择2017年5月至2019年5月于榆林市第一医院收治的69例LN患者为LN组,50例系统
目的通过多频生物电阻抗测量方法检测腹膜透析(PD)治疗心肾综合征患者液体负荷情况,评估其在干体质量调整中的作用。方法选择常州市武进人民医院肾病中心诊断为心肾综合征行P
在老年人中出现的非其他原因引起的耳聋即为老年性聋。人体随年龄的增长会出现衰老现象,如头发变白、牙齿脱落等。老年性聋则是因听觉系统衰老而引起的听觉功能障碍,其发病年龄
Gag蛋白是2 I型免疫缺陷病毒(HIV-1)重要的结构蛋白,可诱导机体产生体液和细胞免疫应答。本试验将HIV-1不同长度的长末端重复序列(LTR)和全长的gagORF置于痘病毒启动子控制下,经过同源重组、红细胞吸附试验