论文部分内容阅读
研究背景:结直肠癌(CRC)是人类第三大最常见的癌症,也是与癌症相关死亡的第四大主要原因。近年来我国结直肠癌的发病率呈上升趋势。结直肠癌早期症状不典型,明确诊断目前主要依靠消化道内镜活检及影像学检查,经济成本与时间成本较高,无法展开普遍筛查。结直肠癌的无创诊疗技术敏感性和特异性较差,限制了其在CRC诊断、预后和生存评价中的应用。结肠癌的发生和发展涉及多个基因及多条信号通路,如EGFR-Ras/Raf/MEK/ERK-MAPK通路。而对结肠癌患者的生存和预后评价,临床尚缺乏有效的评估手段。因此,寻找新的预后标志物对评价结直肠癌病人预后及指导临床治疗非常重要。MicroRNA(miRNA)是小的单链非编码RNA,由内源性基因编码,其作为基因表达的转录后调节剂至关重要,miRNA通过与特定的m RNA结合并对其进行降解,从而调控基因的表达。Mi RNA广泛参与生长、代谢等多种生物学过程,并可以通过调节各种癌基因和抑癌基因的表达从而控制细胞增殖,分化和凋亡。许多miRNA的表达失调参与了结直肠癌(CRC)的发生发展,如miR-21、miR-92a以及miR-200家族成员(miR-200b、miR-200c、miR-141和miR-429)等均被认为与结肠癌密切相关。然而,miRNA通过影响哪些基因及信号通路从而参与各种生物过程,相关研究鲜有报道。Achaete scute-like 2(Ascl2/Mash2/HASH2)编码一种基本的螺旋-环-螺旋(b HLH)结构的转录因子,在胚胎发育期间,其表达主要在胚外组织中检测到,在成年人中,该基因在肠道干细胞中以Wnt依赖性和高度限制性的方式表达,但在其他正常组织中不表达。研究发现,Ascl2在结直肠癌中过表达,并控制着肠道隐窝干细胞和结肠癌祖细胞的分化方向。结肠癌细胞中Ascl2功能的丧失通过抑制microRNA(miR)-200s(即miR-200b,miR200a,miR-429,miR-200c和miR-141)的表达而促进了MET的表达,所以可以认为Ascl2可以通过调节miRNA,对下游靶基因进行调节,从而决定肠道隐窝干细胞和结肠癌祖细胞的转变方向。生物信息学(bioinformatics)是随着人类基因组计划的启动而兴起的一门新兴交叉学科,是生物学、计算机科学、数学、物理学等学科之间的碰撞和融合。生物信息学通过对生物学实验数据的获取、加工、储存、检索与分析,从而达到揭示数据中所蕴含的生物学意义。本研究通过生物信息学的方法,分析LS174T细胞在调低Ascl2表达后miRNA及靶基因表达发生的变化,探索Ascl2通过miRNA调控肿瘤细胞的可能机制。进一步结合TCGA数据集,探索差异表达的基因对结直肠癌患者潜在的临床预后价值,为结直肠癌提供新预后标志物。研究方法:1、收集数据GSE34926:数据由本课题组于前期对LS174T及HT-29细胞干扰Ascl2表达,并分别与相应对照组进行对比,在一段时间后对其中miRNA的表达量进行定量实时PCR的miRNA定量测定,芯片结果以标准化后的miRNA表达量反馈。2、收集数据GSE69036:芯片数据来自GEO数据库,为Antonis Giakountis等对LS174T细胞进行干扰Ascl2表达操作,并分别与相应对照组进行对比,对干扰前后m RNA表达进行定量测定所得的数据。3、对数据集GSE34926处理。将经整理后的miRNA表达数据进行筛选,筛选Ascl2的干扰对表达有显著性影响的miRNA。将受标准化miRNA表达值取log2,使用Helm绘图软件进行热图的绘制,同时进行可视化。4、将差异性表达的miRNA分别使用Target Scan Human、miRDB进行靶基因的预测,并将两个预测结果进行Venn图法取其交集。其结果与Antonis Giakountis鉴定的m RNA再取交集,结果为受Ascl2表达影响的miRNA所调控的靶基因,记为DEGs。5、通过DAVID数据网站,进行GO、KEGG Pathway分析,为DEGs进行功能组分以及在不同信号通路的富集,以提示差异性基因功能以及生物学定位,并利用R软件进行结果的可视化。6、使用STRING数据库构建了DEGs的PPI网络,利用Cytoscape(3.8.0)进行可视化,筛选degree≥10的基因,并绘制PPI图。7、通过cbiopotal网站下载TCGA数据库中594例结直肠癌病人的临床信息及相关基因的表达数据。对相关基因做总体生存分析。8、筛选出4个对患者总体生存期有显著影响的基因进一步做无进展生存期、疾病特异性生存期的生存分析,并利用Graph Pad Prism 8绘图软件绘制生存曲线。研究结果:1、对数据集GSE34926分析发现,在Ascl2被干扰后共有350个miRNA出现差异性表达,其中172个miRNA表达下调,178个miRNA表达上调,上调基因中包括miR-200c,miR-300b,miR-200b,miR-429,miR-141,miR200a等。2、对差异表达miRNA使用Target Scan Human与miRDB分别进行靶基因预测,得到5174个由Ascl2所介导差异表达的miRNA下游靶基因,记为DEGs1。GSE69036共筛选出2116个干扰Ascl2后差异表达的基因。使用Venn法取交集后得到Ascl2所介导的与miRNA相关的基因的集合,共得到534个差异性表达基因。3、GO分析:我们发现上述基因在功能上主要富集在蛋白质的结合,转录因子的活动,与特定序列DNA的结合等方面;在生物过程中,差异基因主要富集在基因的转录调控过程(包括RNA多聚酶II启动子的负调控以及以DNA为模板的正调控)。4、KEGG Pathway分析:KEGG Pathway分析发现差异基因集中在代谢相关通路、MAPK信号通路、Hippo信号通路、癌症相关通路、与癌症中的蛋白聚糖、癌症相关的miRNA等信号通路中。5、在PPI网络分析中,共筛选出(degree≥10)的43个关键基因。发现其中TP53、NRAS、TGFBR1等研究较多的与肿瘤发生及进展相关的基因,与其他基因之间有较多的相互作用关系。6、对关键基因进行生存分析后选出4个基因进一步分析,发现肿瘤组织中COPS3的表达水平对结直肠癌患者总体生存期、无进展生存期和疾病特异性生存期的有较大影响,DYNLL2的表达水平对结直肠癌患者总体生存期、疾病特异性生存期有较大影响,RAB6A、COPG1的表达水平与结直肠癌患者总体生存期影响较大,而对无进展生存期和疾病特异性生存期影响无显著性差异。研究结论:1、本研究使用生物信息学的分析方法,识别了LS174T细胞中Ascl2所介导的与miRNA相关的基因。为将来进一步研究Ascl2与miRNA的关系提供了基础。2、筛选出的差异表达基因在与蛋白结合及基因的转录调控过程中有较多的富集,并在代谢相关通路、MAPK信号通路、Hippo信号通路、癌症相关通路、与癌症中的蛋白聚糖较为集中,提示在结直肠癌细胞中,Ascl2可能通过调控miRNA而在以上通路中发挥作用。为进一步研究Ascl2在结直肠癌中的调控机制提供依据。3、我们对PPI网络分析中的关键基因进行分析,发现在结直肠癌病人中,COPS3、DYNLL2、RAB6A、COPG1的表达量在不同程度上可以对结直肠癌病人的预后有影响。为结直肠癌提供了新的可能的预后标志物,有助于了解结直肠癌发生发展的机制,为预防和治疗结直肠癌提供新的思路。