论文部分内容阅读
自然反义转录物(NATs)是排除掉人为干扰的情况下,能够在生物体内自然生成的反义RNA。这一类RNA通过碱基互补的方式与其对应的RNA形成有义-反义转录物。有义链和反义链由来源于基因组上相同位点的不同链转录得到的NATs,称为顺式NAT(cis-NATs)。多项研究表明,cis-NATs能够通过转录激活或沉默机制来促进或者抑制其有义链基因的表达、稳定、可变剪接和转录后调节。但对于cis-NATs的研究由于研究方法的局限性,包括低精度和低通量,使得大量低表达水平的反义基因没有被检测到,同时反义转录本在癌症中的的发现和定量也受到样本数据集偏少的局限。而转录组测序分析方法由于其通量高、准确性高、运行成本低等优点,能够很好的解决低表达基因难以被检测到的问题。 Dicer是RNaseⅢ家族中能够特异识别双链RNA的一种核糖核酸内切酶。已有研究表明Dicer能够限制有害的内源双链RNA在细胞内的积累。 目的: 通过构建抑制Dicer基因表达的克隆细胞,研究Dicer对cis-NATs的表达调节作用。基于大量结直肠癌组织样本的基因表达谱数据,分析cis-NATs在结直肠癌中的表达特性,以及cis-NATs基因对结直肠癌病人的影响。 方法: 本文对分别转染了shDicer1和shCon2的HCT116的两个克隆细胞D1和CON2进行链特异性转录组测序(ssRNA-seq)和小RNA测序(sRNA-seq),并对测序产生的数据,采用基于生物信息学的分析方法进行分析。分析在抑制Dicer基因的表达后,对cis-NATs基因表达变化的影响以及对双链重叠区域小RNA表达变化的影响。 本文通过寻找来源于基因组上相同位点的不同链上的两个基因,结合各个基因在TCGA数据库中433例结直肠癌样本中的表达信息,得到在结直肠癌中表达的cis-NATs。通过比较cis-NATs基因在肿瘤和正常样本中的表达差异变化以及该基因表达量的高低对病人预后的影响,分析得到与疾病相关联的基因。 结果: 本文通过分析抑制Dicer基因表达后的HCT116克隆细胞的转录组和小RNA测序数据,共得到1512个cis-NATs记录。其中仅2个cis-NATs基因的表达变化以及双链重叠区域小RNA的表达变化符合Dicer的调节作用影响,但生成的小RNA并不符合Dicer的酶切产物特征。我们利用TCGA数据库中的结直肠癌样本,计算Dicer与cis-NATs基因在表达水平上的相关性,发现二者的表达水平并没有相关性。 本文在结直肠癌组织样本中共发现1296(7.15%)个基因能够参与形成669对cis-NATs,并且其中79.22%的cis-NATs的重叠区域集中在3/5端,并且70.10%的cis-NATs都是在编码基因和编码基因之间形成的。形成cis-NATs的两个基因在表达水平上存在较强的正向相关性(中位皮尔森相关系数为0.29),同时发现5端重叠的两个基因间的相关性最强。根据基因在肿瘤中的表达差异变化以及基因表达量高低对病人预后的影响进行联合分析,我们筛选得到276个基因且该类基因能够富集到多种人类疾病通路上。 结论: Dicer并不能通过酶切cis-NATs的双链区域进而调控cis-NATs的表达。 通过对结直肠癌的大量组织样本的基因表达谱数据进行cis-NATs的表达分析,通过整合基因在肿瘤中的差异性表达变化数据和基因表达高低对病人预后的影响数据,为研究者们寻找疾病标志物基因提供了一个新的思路。