论文部分内容阅读
目的胃癌的发生发展进程是一个多因素参与的复杂生物学过程。竞争性内源RNA(competing endogenous RNA,ce RNA)假说认为m RNA、lnc RNA等转录物可以通过mi RNA应答元件(mi RNA response element,MRE)竞争性结合micro RNA,相互联系进而调控各自的表达水平,从而产生大规模的调控网络。其中mi RNA在网络中作为中介因子发挥着重要作用,竞争性内源RNA特别是胃癌相关ce RNA的相互作用尚未完全阐明。因此,探索胃癌相关ce RNA的互作关系对于阐明胃癌的发病机制将有重要意义。本研究拟在系统生物学基础上,利用整合组学的理念,筛选胃癌相关的功能性mi RNA。应用生物信息学方法对数据进行深入挖掘,并通过它们之间的调控关系进行预测分析和数据整合,构建胃癌相关ce RNA调控网络,从中寻找发挥关键作用的因子。为胃癌的发病机制研究提供新的思路。方法整合m RNA和mi RNA两个层次的表达谱数据。采用POMA(The Pipeline of Outlier Micro RNA Analysis)算法,寻找在胃癌中具有调控功能的活性mi RNA,筛选胃癌发病相关的可靠分子标志物。并对胃癌相关的mi RNA靶基因进行GO功能水平以及KEGG通路水平的富集分析。进而利用基因功能富集分析筛选靶基因中与胃癌相关的关键基因。基于筛选得到的胃癌调控活性mi RNA,利用公共数据库预测mi RNA相关的lnc RNA,并通过胃癌mi RNA-m RNA子网络提取mi RNA靶基因信息,以mi RNA为中介因子,重新构建ce RNA相互作用网络。并对网络的性质进行评价和分析。最后以胃癌相关的关键基因作为映射,探索胃癌特异性的子网络,以挖掘调控网络中的关键因子。结果(1)基于POMA算法,筛选胃癌功能性micro RNA,其中利用基因芯片筛选出30 mi RNA,通过公共数据库筛选出24个mi RNA,最终获得不同数据组中整合的36个mi RNA。(2)基因富集分析中,发现了7个胃癌相关关键基因,分别是TP53,PIK3CA,VIM,ERBB2,CDK1,CDH1,TGFB1。通路显著性分析发现11条胃癌相关重要通路,其中通路Pathways in cancer(XD-score=0.783),Colorectal cancer(XD-score=0.710)以及Adherens junction(XD-score=0.709)是三条最显著的通路。(3)通过mi RNA基因芯片验证,确定了16个胃癌相关调控活性的mi RNA,使用生物信息学方法和预测软件发现lnc RNA与筛选出的micro RNA有不同程度的关联。(4)网络分析显示ce RNA网络为典型的生物网络特征,并且具有一定的稳健性。以关键基因映射得到了ce RNA子网络:包括5个mi RNA(mi R-21-5P,mi R-34a-5P,mi R-193b-3p,mi R-25-3P,mi R-125b)8个lnc RNA(HCG18,XIST,HMGB1,H19,NEAT1,MALAT1,KCNQIOT1,TUG1)和3个基因(TP53,ERBB2,CDH1)。结论(1)通过系统生物学和组学结合的方法筛选验证得到15个胃癌相关调控活性mi RNA,生物信息学方法预测7个胃癌相关关键基因以及3条显著富集通路。为胃癌的发病机制提供思路和方向。(2)构建的胃癌ce RNA调控网络稳健性良好,其中包括5个mi RNA,8个lnc RNA和3个基因。它们可能在胃癌的发生、发展中作为关键因子发挥作用。