基于干性指数开展结直肠癌干细胞关键基因的生信分析

来源 :中国医科大学 | 被引量 : 0次 | 上传用户:caicai432111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的:结直肠癌(Colorectal Cancer,CRC)是目前最常见和最致命的癌症之一,结肠腺癌(Colonic Adenocarcinoma,COAD)是CRC中最常见的病理分型。我国高达83%的结直肠癌患者首次确诊时就已处于中晚期,不难看出,结直肠癌的诊治充满着很多挑战。同时,结肠癌的发生发展也是一个非常复杂的过程,涉及到多种细胞活动和各种信号通路。随着肿瘤异质性的逐渐揭示,肿瘤干细胞(Cancer Stem Cells,CSCs)正被认为是肿瘤发生的最初组成部分。然而,COAD干细胞的生长和维持机制尚不清楚。为了更好地描述CSCs的特征,Tathiane M.马耳他等人于2018年发表在《CELL》中根据TCGA中肿瘤细胞和胚胎干细胞的遗传图谱,利用一元逻辑回归(One-class Logistic Regression,OCLR)根据肿瘤的去分化特征提出了一个新的指标——干性指数(m RNA Expression Based Stemness Index,m RNAsi)。本研究通过生物信息学大数据分析结合干性指数,探索与COAD干性特征相关的关键基因,这将有助于后续继续探索COAD干细胞的分子机制,并为COAD未来的诊断和治疗提供一些参考。研究方法:从TCGA数据库下载COAD的RNA测序(RNA-Seq)表达数据以及相应临床信息。从Tathiane M.马耳他的文章附件中获得了TCGA中COAD病例的干性指数m RNAsi数据,分析了COAD中癌症与癌旁样本中的m RNAsi差异性。用log2对COAD的RNA-Seq原始表达数据进行转化,利用R语言中的Limma包进行差异表达基因(DEGS)分析。选择DEGS的标准为:|log2FC|>1,P<0.01,FDR<0.05;利用R中的WGCNA包构建了一个针对DEGS的共表达网络并识别其中的关键模块和基因。利用在线STRING数据库得到干性相关的关键基因的蛋白-蛋白相互作用网络(PPI网络互作图),并利用R中的corrplot包验证了干性相关的关键基因转录水平上的Pearson相关性。然后,利用R语言中的聚类分析器对挑选出来的干性相关的关键基因进行基因本体(GO)功能注释和京都基因和基因组百科全书(KEGG)分析,探究其参与的生物过程与信号通路。结果:1、COAD组织与正常组织间的DEGs。本研究从Tathiane M.马耳他的文章附件中获得了TCGA中COAD病例的m RNAsi,从TCGA数据库中下载了452个COAD病例的相应临床信息。通过差异分析发现COAD癌组织中的m RNAsi明显高于正常组织。从TCGA数据库中下载COAD的RNA-Seq数据,包括41个正常样本和473个COAD样本,并筛选了COAD组织与正常组织之间的DEGS,通过差异分析我们得到了6478个DEGS,其中4562个上调,1916个下调。2、通过WGCNA进行对m RNAsi相关模块和基因的鉴定。利用WGCNA构建了一个DEGS共表达网络,得到生物基因模块,选择其中正相关系数最大的绿色模块,将选择标准定义为cor.MM>0.8和cor.GS>0.5来筛选得到干性相关的关键基因,筛选得到CHEK1、BUB1、KIF18A、TTK和PLK4这5个干性相关的关键基因。提取每个干性相关的关键基因的具体表达值,绘制热图和盒图,结果表明这5个干性相关的关键基因在COAD组织中明显过表达。3、利用PPI网络等对干性相关的关键基因与蛋白质水平的相关性进行研究。对5个干性相关的关键基因进行相关性分析,发现干性相关的关键基因之间有很强的、有统计学意义的相关性。利用STRING在线工具分析了干性相关的关键基因之间的蛋白质相互作用关系并且分析了在PPI网络中的每个节点基因的边缘数,结果表明每个基因的边缘数相等。4、采用GO和KEGG分析对干性相关的关键基因进行功能注释和通路分析。GO注释显示干性相关的关键基因共同参与的生物过程(BP)主要集中在细胞器裂变、核裂变,有丝分裂核分裂和细胞周期相变的调控等;参与的细胞组成(CC)与染色体区域等相关;参与的分子功能(MF)与蛋白丝氨酸/苏氨酸激酶活性等相关。KEGG富集分析显示干性相关的关键基因参与细胞器裂变、核裂变,有丝分裂核分裂和细胞周期相变的调控等信号通路。结论:筛选得到CHEK1、BUB1,KIF18A、TTK和PLK4这5个与COAD干性特征密切相关的基因,经过基因功能富集得到与COAD干细胞最重要的相关信号通路是细胞周期通路。
其他文献
目的:TMEM16A(也称为Anoctamin 1,ANO1)是钙激活氯离子通道的分子基础,有10个跨膜结构域。TMEM16A广泛分布在多种细胞中,并参与调节多种重要的生理功能。TMEM16A在包括乳腺癌在内的多种肿瘤中高表达且与患者的不良预后相关。他汀类药物(statins)是临床常用的一线降脂药,为羟甲基戊二酸单酰辅酶A(HMG-Co A)还原酶抑制剂,常用于心血管疾病的治疗。他汀类药物对包括
目的:DNA甲基化驱动基因在结直肠癌(colorectal cancer,CRC)发生发展中扮演着重要的角色,但是临床意义不明,亟待研究。本课题旨在探究结直肠癌特异性高表达的DNA甲基化驱动基因,重点研究其生物功能与临床意义;本论文通过分析DNA甲基化驱动基因建立预后风险评估模型并分析了风险模型中患者的药物治疗反应。方法:本篇应用“Methylmix”R包中的算法,对来自癌症基因组图谱(The C
目的:我国每年胃癌(Gastric Cancer,GC)新发病例约占全球发病病例的一半,是高发国家。幽门螺杆菌(Helicobacter Pylori,H.Pylori)感染与GC的发生发展密切相关。肿瘤干细胞(Cancer Stem Cells,CSCs)在肿瘤的生存、增殖、转移和复发中发挥着重要作用。然而,CSCs与伴有幽门螺杆菌感染的胃癌(Helicobacter pylori positi
目的:前列腺癌(prostate cancer,PCa)已成为男性最常见的恶性肿瘤之一,尤其好发于中年男性。PCa不仅是男性的主要癌症类疾病,约占男性癌症疾病的10%,而且有较高的致死率。因此本次研究基于生物信息学的分析方法,筛选出与PCa预后相关的关键基因并建立风险回归模型,具有重要意义。研究方法:从癌症基因组图谱数据库(TCGA)中选取前列腺癌患者(PCa)的转录谱和临床数据集,使用R(3.6
目的:评估Daratumumab(DARA)治疗复发难治性多发性骨髓瘤(relapsed and refractory multiple myeloma,RRMM)的临床疗效、安全性及生存状况,为临床治疗提供真实世界数据。方法:本研究收集2019年11月至2021年2月在中国医科大学附属盛京医院就诊的21例RRMM患者,随访时间截止至2021年2月28日。患者接受DARA单药或与其他药物联合治疗方
目的:通过Meta分析和生物信息学分析,分析EGFR、ERBB2、FGFR2、FGFR4四个基因在癌症中的表达及突变情况,寻找可能影响癌症易感性的单核苷酸突变位点,为癌症预测和早期筛查提供循证医学证据。研究方法:本研究通过检索中国知网、万方数据、Pub Med、Web of Science等数据库,收集了截止2020年12月的所有符合纳入标准的病例-对照实验研究。对纳入的文献进行荟萃分析,同时根据
背景:多项研究表明,长链非编码RNA HOX转录反义RNA(HOTAIR)在人类癌症中上调,这与一些临床特征相关,并可能作为预后标志物。然而,HOTAIR在肝癌中的意义尚不清楚。我们进行了一项荟萃分析,以分析HOTAIR和肝癌之间的关系,并且进一步以实验验证影响因素及可能作用机制。研究方法:系统检索Pub Med、Embase、Web of Science、Clinical key等数据库。采用9
目的:利用TCGA数据库资源,探索与直肠癌发病相关的潜在关键基因、信号通路、探寻关键基因的表达与预后的关系,并寻找可作用于关键基因靶点的靶向药物。实验方法:本研究利用TCGA数据平台(https://portal.gdc.cancer.gov/)下载167例直肠癌组织和10例癌旁正常组织的基因表达数据和相关临床数据,根据|log2(fold change)|>2、P值<0.05的筛选标准,筛选16
目的:回顾性分析低风险甲状腺乳头状癌患者术后TSH水平,探讨不同TSH水平对复发的影响。方法:回顾性分析辽阳市中心医院普外科2014年至2016年间的低风险甲状腺乳头状癌根治手术的患者(n=486)被纳入本研究,所有患者均行单侧腺叶全部切除+峡部切除+中央区淋巴结清扫或甲状腺全部切除术+中央区淋巴结清扫,根据整个随访期5年的TSH优势值,将患者分为3组(A组2.
目的:采用多对比度一站式弛豫定量技术(magnetic resonance imaging compilation,Magic)定量测量T1、T2值,探讨磁共振平扫的T1、T2值及增强后的T1值在脑胶质瘤分级及细胞增殖活性预测中的临床价值。材料和方法:回顾性分析经过病理证实的36例脑胶质瘤患者,包括21例高级别胶质瘤(high grade glioma,HGG)和15例低级别胶质瘤(low gra