基于RNA-seq的肝癌加权基因共表达网络的构建与分析

来源 :温州医科大学 | 被引量 : 0次 | 上传用户:zhmwq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究背景:
  肝癌是世界上发病率和死亡率最高的癌症之一,在我国,肝癌男性发病率和死亡率均排第二,女性发病率排第六,死亡率排第五。由于肝癌的发生机制复杂,以及缺乏有效的早期诊断标志物和治疗方法,致使肝癌患者的死亡率较高。近年来,肝脏移植、手术切除肿瘤、放疗和化疗方面虽然取得了较大的进展,但肝癌的高复发率使得患者的五年生存率仅有44%。因此,研究肝癌的发生发展机制并寻找肝癌诊断的新型标志物及治疗靶点迫在眉睫。
  多种组学技术(如基因组、转录组、蛋白质组和代谢组)的不断发展形成了一种新的生物学研究模式,即利用已有的数据信息,通过多组学技术整合生物系统中诸多相互联系和作用的组分来研究复杂的生物过程,深入了解疾病发生的机制。
  研究目的:
  1.基于转录组测序数据和microRNA(miRNA)测序数据,鉴定肝癌组织中的差异表达基因和miRNA;
  2.通过差异基因的加权共表达网络分析,鉴定与肝癌临床特征显著相关的基因模块和miRNA模块;
  3.通过筛选候选模块枢纽基因,鉴定肝癌中预后相关的关键基因和miRNA,为临床诊断提供帮助;
  4.通过关联基因模块和miRNA模块,构建miRNA调控的代谢通路网络,鉴定肝癌中关键信号通路,为探索肝癌的发病机制提供基础。
  研究方法:
  1.基于TCGA数据库GDCDataPortal数据平台以及GTEx数据库获取肝癌的转录组测序数据、miRNA测序数据以及对应样本的临床信息。基于GEO数据库获取用于验证的肝癌转录组测序数据;
  2.利用R软件DEseq2分析包和edgeR分析包分别对肿瘤样本与癌旁对照样本间差异性表达的mRNA、miRNA进行分析;
  3.利用加权基因共表达网络(Weighted Gene Co-expression NetworkAnalysis, WGCNA)分别构建差异基因的共表达网络和miRNA共表达网络,关联临床样本性状,确定与肝癌病理特征显著相关的候选模块;
  4.对于候选基因模块和miRNA模块,基于weight>0.10分别绘制基因互相作用网络和miRNA互相作用网络,依据连接度筛选前10位为候选枢纽基因,其中连接度最高的为核心基因;
  5.基于TCGA数据和验证数据集对候选模块枢纽基因和miRNA绘制表达量热图,鉴定模块分类的稳定性;
  6.基于TCGA数据对候选枢纽基因和miRNA进行不同肿瘤分期表达量分析,并绘制箱线图,使用单因素方差分析鉴定与肿瘤分期显著相关的基因和miRNA;
  7.对肿瘤分期相关基因和miRNA进行生存分析,并绘制Kaplan-Meier生存曲线,鉴定预后相关的枢纽基因和miRNA;
  8.使用GO和KEGG数据库对候选模块基因进行生物学功能注释和信号通路富集;
  9.使用STRING数据库得到基因对应蛋白的互相作用关系,构建蛋白-蛋白互作网络,识别蛋白主要功能簇;
  10.使用Starbase数据库得到miRNA与基因之间的互作调控关系,预测模块miRNA的靶基因;使用clueGO对预测的靶基因进行KEGG信号通路富集;
  11.使用得到的miRNA-gene靶向调控关系构建基因模块与miRNA模块关联的肝癌相关代谢通路网络,明确核心miRNA,并鉴定参与肝癌的主要信号通路。
  研究结果:
  1.通过TCGA数据库检索,共有422例样本,其中包括371例肝癌组织和50例正常组织,收集相对应的转录组测序数据和miRNA测序数据。从GTEx数据库中收集到177例正常肝组织的转录组测序数据。从GEO数据库收集到转录组测序数据集两个,其一编号为GSE124535,包含35例肝癌组织样本和35例对应癌旁组织样本,另一编号为GSE97214,包含9例肝癌组织样本和9例对应癌旁组织样本;另还有一个miRNA测序数据集GSE76903,包含20例肝癌组织样本和20例对应癌旁组织样本;
  2.基于R软件的DEseq2和edgeR分析包进行差异表达分析并对结果取交集,共鉴定了5075个差异基因;258个差异miRNA;
  3.基于差异基因加权构建共表达网络,共鉴定出24个基因模块,其中blue模块与brown模块与样本类型和肿瘤分期呈显著正相关(R2>0.4,P<0.05),black模块与样本类型和肿瘤分期呈显著负相关(R2<-0.6,P<0.05),将之作为下一步研究的候选模块;
  4.根据模块内基因连接度,共选出30个模块枢纽基因,其中SNRPB、COLEC10和RHNO1分别是三个模块的核心基因;表达量热图结果显示,blue模块和brown模块的基因在TCGA数据集和GEO数据集中均呈现肿瘤中高表达,black模块的基因均呈现低表达现象。对核心基因进行多肿瘤表达量研究,结果显示COLEC10在肝细胞肝癌和胆管细胞肝癌中特异性表达量下调;
  5.对关键模块blue模块和brown模块中枢纽基因的不同分期表达量分析显示,20个枢纽基因在肝癌不同分期中表达量均呈上升趋势,且单因素方差分析结果具有统计学意义(P<0.05);black模块中7个枢纽基因在不同分期中表达量呈下降趋势,单因素方差分析结果具有统计学意义(P<0.05);
  6.对27个枢纽基因进行生存分析,结果显示有22个基因与预后显著相关(P<0.05);
  7.基于miRNA数据构建miRNA共表达网络,共鉴定出15个模块,其中turquoise模块与样本类型(r=0.27)和肿瘤分级(r=0.32)呈现显著正相关(P<0.05),red模块和yellow模块与样本类型和肿瘤分期呈中等程度显著负相关(R2<-0.4,P<0.05),将之作为下一步研究的候选模块;
  8.根据模块内连接度和差异表达,共选出22个模块枢纽miRNA,其中turquoise模块中7个,red模块中10个,yellow模块中5个,核心miRNA分别是miR-877、miR-101-3p和miR-199a-5p。表达量热图结果显示,turquoise模块的miRNA在TCGA数据集和GEO数据集中均呈现肿瘤中高表达,red模块和yellow的miRNA均呈现低表达现象;
  9.对22个枢纽miRNA的不同分期表达量绘制箱线图并使用单因素方差分析,结果显示,turquoise模块中有6个miRNA在不同分期中表达量呈显著上升趋势(P<0.05);red模块和yellow中分别有1个和1个呈显著下降趋势(P<0.05);
  10.对8个肿瘤分期相关的枢纽miRNA进行生存分析,结果显示有5个miRNA与预后显著相关(P<0.05),分别是miR-1226、miR-301a、miR-1180、miR-501和miR-877;
  11.通过GO分析和KEGG信号通路分析,blue模块内的基因主要参与了线粒体相关的生物学过程及信号通路,如ATP合成、线粒体呼吸链复合体组装、线粒体氧化磷酸化等;brown模块的基因主要参与细胞周期、DNA修复、端粒维持、P53等信号通路;black模块的基因主要参与细胞炎症因子相关的信号通路,如JAK-STAT信号通路;
  12.使用STRING得到三个基因模块的蛋白-蛋白互作网络,blue模块的蛋白簇主要集中在核糖体蛋白和电子传递链相关蛋白上,brown模块集中在细胞周期和有丝分裂相关蛋白,black模块集中了一些转录因子,如c-JUN、c-FOS、ATF3以及炎症因子和趋化因子,如IL6、CXCL12等,与我们基因的富集结果一致;
  13.使用Starbase数据库,turquoise模块枢纽miRNA共得到7593个靶基因,red模块得到4251个靶基因,yellow模块得到3926个靶基因,通路富集分析显示其主要参与细胞生长、p53信号通路、MAPK信号通路等;
  14.使用预测的miRNA调控关系构建了基因模块与miRNA模块关联的肝癌相关代谢通路,包含了MAPK信号通路为主的7条相关通路,其中miR-424-5p和miR-195-5p起核心调控作用。
  研究结论:
  1.本研究利用转录组学测序数据和miRNA测序数据,构建了肝癌的基因共表达网络和miRNA共表达网络,鉴定了与肝癌分期和组织类型显著相关的3个基因模块和3个miRNA模块;
  2.通过模块内枢纽基因和miRNA分析,鉴定了与预后相关的13个关键基因和5个关键miRNA;
  3.miR-199a-3p、miR-877和miR-101-5p是三个miRNA模块中的核心miRNA,SNRPB、COLEC10和RHNO1是三个基因模块的核心基因,且COLEC10在肝癌中呈现特异性表达,可作为下一步分子机制研究的候选基因;
  3.GO分析和KEGG通路分析显示肝癌的发生发展主要参与线粒体氧化磷酸化、ATP合成及细胞周期和炎症反应等生物学过程;
  4.通过构建miRNA-gene模块关联网络,鉴定了以miR-424-5p和miR-195-5p为核心调控因子的MAPK信号通路为主的7条肝癌相关信号通路。
其他文献
背景目的:  急性呼吸窘迫综合征(ARDS)是由肺内(外)因素引起的,以顽固性低氧血症为显著特征的临床综合征,因其高病死率而倍受关注。目前,国际上多采用“柏林定义”对ARDS做出诊断及其严重程度进行分层,并需与多种疾病进行鉴别诊断。除保护性机械通气治疗外,目前尚未找到经过证明的能降低其病死率以及能改善其预后的有效治疗策略。其病理生理变化主要是肺泡上皮结构的毁损性破坏,导致肺泡上皮屏障结果的破坏,进
会议
会议
会议
第一章三维石墨烯@镍可抛式电极的制备及表征  目的:采用简便可控的方法,合成机械性能良好的三维石墨烯复合材料,应用材料批量制备三维可抛式电极.  方法:以商业化的泡沫镍为模板,甲烷为碳源,氢气为还原气体,氮气为保护气体,在高温管式炉中,采用化学气相沉积法合成三维石墨烯@镍(3D G@Ni)复合材料.利用扫描电子显微镜(SEM)、拉曼光谱仪(Raman)对合成的材料进行表征.采用自制的打孔器将材料裁
目的:新生血管性眼病已成为全球范围内仅次于白内障的第二大致盲性眼病,且其致盲比例仍在逐年增加。多巴胺(dopamine, DA)已被证明在肿瘤以及皮肤创伤愈合等模型中的血管新生中发挥着重要作用。而其作为眼内最重要的神经递质之一,在新生血管危害巨大的眼部疾病中是否也有多巴胺系统的参与。本课题聚焦于多巴胺D1受体(dopamine D1receptor, DRD1),分别在视网膜及脉络膜新生血管模型中
第一部分:PDE4B与近视的相关性验证研究  目的:本课题组前期实验中,通过对高度近视和正常对照人群进行全基因组关联分析(GWAS),发现了一个和高度近视相关的SNPrs10889602。该SNP位于PDE4B基因的第三个内含子上,提示PDE4B可能是高度近视的一个易感基因。本实验将进一步明确SNPrs10889602是否影响PDE4B基因表达水平,以及PDE4B是否参与小鼠形觉剥夺性近视的形成。
学位
学位
会议
期刊