论文部分内容阅读
弓形虫有着极其复杂的生活史和包括人类在内广泛的中间宿主,是一种有致命威胁的食源性、机会性致病原虫,其机会性致病的生物学基础是速殖子和缓殖子的相互转化。弓形虫速殖子与缓殖子的转化过程伴随着二者形态、生理代谢和基因水平的大量转变,这些变化通常是在转录水平调控的,但对弓形虫基因组数据库(http://toxodb.org/toxo/)的分析却发现:弓形虫的基因组中只有极少的转录因子序列存在,而其他顶端复合物亚门的寄生原虫如疟原虫和隐孢子虫也是如此。而以往的研究证明:越是高等的生物,其编码转录因子的转录组在基因组中所占的比率越高,如酵母为3.4%、线虫为4.2%、果蝇为5.5%、人为8%。弓形虫速殖子与缓殖子转化过程中基因表达的大量变化与其基因组中转录因子数量的不成比例,提示我们除了常规的转录因子介导其基因表达调控外,在这些较为低级的寄生原虫中还必然存在着其他的调控途径,niRNA有可能是弓形虫基因表达调控的机制之一吗?研究发现,弓形虫体内存在一个有趣的RNA沉默机器:植物同源的Tg-Dicer、真菌同源的RNA聚合酶和带哺乳动物特征的AGO蛋白。在以上前提下,2010年,Braun等[26]第一次向世界揭示了从HFF细胞中收集的基因Ⅰ型弓形虫RH株速殖子的小RNA转录组,发现14个miRNA家族。2012年陈启军领导的研究小组继Hakimi等之后首次比较研究了来源于体内的基因Ⅰ和Ⅱ型速殖子的sRNA表达谱。他们发现17个与人和小鼠保守的miRNA,同时发现339个新的弓形虫miRNA,可将后者归为57个miRNA家族。在RH株速殖子中表达上调的有155个miRNA,在ME49株速殖子中表达上调的有20个miRNA。比较分析以上弓形虫的miRNA,在RH株速殖子和ME49株速殖子中保守表达的miRNA有6个,综合分析miRNA表达差异发现:在不同基因型弓形虫速殖子中,该物种内保守miRNA表达方式和趋势有差异;同一基因型弓形虫速殖子,在不同宿主细胞和环境中生长繁殖,该物种内保守miRNA的表达方式和趋势也有差异。可见,miRNA极其可能在弓形虫基因的转录后水平起着重要的调节作用。然而miRNA的种类、数量及在同一基因型弓形虫速殖子和缓殖子相互转化过程中可能的调控作用目前尚是未知。因此,从miRNA方面研究弓形虫机会性致病的调节机制有可能揭开其调节内幕,也必将为人类最终控制弓形虫病开辟一条新的途径,同时也将为miRNA起源注入丰富的解读。目的1.急慢性弓形虫感染的动物模型的建立。2.纯化收集速殖子和缓殖子提取总RNA。3.对速殖子和缓殖子小RNA进行solexa测序,生物信息学分析速殖子和缓殖子中miRNA的特征和联系来探讨其在相互转化的基因表达中所起的调控作用。方法1.PRU株弓形虫慢性感染动物模型的建立。2.PRU株弓形虫慢性感染小鼠脑内包囊的收集纯化。3.PRU株弓形虫纯化包囊消化及缓殖子RNA提取。4.PRU株弓形虫急性感染动物模型的建立。5.PRU株速殖子的体外培养、纯化和总RNA提取。6.PRU株弓形虫速殖子和缓殖子小RNA建库、高通量测序和生物信息学分析6.1原始序列的一般处理6.2 PRU速殖子和缓殖子小RNA序列的基因组学归类分析6.3 PRU速殖子和缓殖子小RNA数据的长度分布比较6.4统计PRU速殖子和缓殖子小RNA数据间公共序列和特有序列的种类(用unique表示)及数量(用total表示)分布情况6.5对PRU速殖子和缓殖子小RNA序列的注释分析6.6已知niRNA在弓形虫基因组上的再预测及其在两样本中的差异表达分析6.6.1已知miRNA在弓形虫基因组上的再预测选择被注释为已知miRNA的小RNA,以ToxDB上弓形虫基因Ⅰ型、Ⅱ型、Ⅲ型的基因组为参考基因组,以华大自主研发的软件-Mireap验证预测。6.6.2然后用RNAfold(http://ma.tbi.univie.ac.at/cgi.Bin/RNAfold.cgi)分析其最低能量构象。6.6.3对两个样品中能在弓形虫基因组上所预测出的miRNA统计,采用Poisson分布方法对其在两样品中的表达进行差异分析,以P<0.01为差异有统计学意义。6.7.在弓形虫基因组上进行新miRNA的预测及其在两样本中的差异表达分析6.7.1新miRNA序列的预测。选择没有任何注释的小RNA,以ToxDB上弓形虫基因Ⅰ型、Ⅱ型、Ⅲ型的基因组为参考基因组,以华大自主研发的软件-Mireap进行预测。6.7.2然后用RNAfold(http://ma.tbi.univie.ac.at/cgi.Bin/RNAfold.cgi)分析其最低能量构象。6.7.3对两个样品中新预测出的miRNA统计,采用Poisson分布方法对其在两样品中的的表达进行差异分析,以P<0.01为差异有统计学意义。6.8新miRNA特征描述对不同长度的候选miRNA的首位点碱基分布及所有候选miRNA各位点碱基分布进行统计。可根据已知miRNA的碱基偏好性的统计结果,对预测新miRNA的准确性进行评价。6.9 PRU弓形虫中4对特殊miRNA分析和PRU株弓形虫miRNA中seed区相对保守的miRNA。6.10 PRU速殖子和缓殖子新miRNA的靶基因预测对Mireap预测出的miRNA进行靶基因预测,得到可预测出靶基因的miRNA数量以及这些miRNA的预测靶基因数量。6.11 PRU速殖子和缓殖子新miRNA靶基因的GO和KEGG功能分析。6.12弓形虫种内保守miRNA。结果1在急性发病期约死亡小鼠50%,感染后一个月慢性感染模型建立成功。2.采用Ficoll等密度梯度水平离心的方法可纯化收集到所需的约11万弓形虫包囊(Fig 2-1)。3.1我们在镜下观察发现Trizol试剂不能充分渗透弓形虫囊壁裂解缓殖子(Fig 3-2)。3.2以0.25%胰酶室温消化弓形虫囊壁1min,缓殖子活力良好(Fig3-3)。溴酚蓝活体染色着色阳性(Fig 3-4)和胎盘蓝死体染色阴性(Fig 3-5)。3.3 Trizol提取缓殖子总RNA质检合格(Fig 3-7)。4.急性动物模型建立成功,PRU株弓形虫缓殖子被活化为速殖子(Fig.4-1)。5.将体内获得的PRU速殖子在体外HFF细胞中培养,感染弓形虫速殖子后的第7天(Fig 5-2),收集纯化从假包囊破裂释放出的速殖子,提取到质量合格的总RNA(Fig 5-4)。6.1 PRU速殖子和缓殖子小RNA建库成功并进行高通量测序,将所测序列去接头、去低质量reads、去污染等处理后,速殖子和缓殖子所得clean reads分别为9206309条、9873245条((Table.6-1、6-2)。两样品所测序列的长度在10-28 nt中均呈正态分布,速殖子和缓殖子的长度分布高峰在21 nt、20 nt(Fig.6-9、6-10)。6.2 PRU株弓形虫缓殖子和速殖子小RNA序列的基因学分析6.2.1速殖子小RNA数据中仅能匹配到人类基因组上的序列有507371条(Table 6-3),占5.51%,大部分(52.4%)(Fig6-11A、Fig6-11B)序列能比对到ToxoDB基因组数据库中,而弓形虫的序列种类数目相对较小,仅占了总类别的9.72%。而那些没有注释的小RNA片段占总序列读数的38.53%,其sRNA种类数最多,约占81.32%6.2.2缓殖子小RNA数据中仅能匹配到小鼠基因组上的序列有3173753条,占32.15%,其小RNA的种类数大部分(51.67%)(Fig6-12A、Fig6-12B)序列能比对到ToxDB基因组数据库中,而弓形虫的序列种类数目相对较小219428 (Table 6-3),占了总类别的19.84%。而那些没有注释的小RNA片段占总序列读数的11.49%,其sRNA种类数相对较速殖子的少,为250521,约占22.66%。6.3速殖子小RNA的长度分布主要在18-23nt范围内,峰值出现在21 nt处。缓殖子小RNA的长度分布范围也在18-23nt之间,而峰值出现在在20nt处(Figure 6-13)。6.4在速殖子小RNA中,94.13%的(511692种)小RNA为速殖子期特异性序列;在缓殖子小RNA中,93.05%的(452710种)小RNA为缓殖子期特异性序列;速殖子和缓殖子共同的小RNA仅为31914条(Fig 6-14)。6.5 将得到的543606种速殖子和484624种缓殖子小RNA,与miRBase 19.0.NCBI Genbank、Rfarm比对,将样品中已知的rRNA, tRNA, snRNA, snoRNA repeat、exon、intron进行分类注释。速殖子和缓殖子中各种类RNA所占比例相似(Fig 6-15A、Fig 6-15B).6.6在弓形虫基因组上,重新以Mireap软件预测验证经miRBase19.0注释的已知niRNA。将速殖子小RNA中的45105条已知miRNA和缓殖子小RNA中的47606条已知miRNA,在目前ToxDB的三型(TgGT1、TgME49、TgVEG)弓形虫genome背景下,用Mireap软件重新预测miRNA(图6-16),发现与hsa-mir-miR-4463和cin-mir-miR-4183-5p相似的两条保守miRNA:PRU.Tg.miR-4463和PRU.Tg.miR-4183-5P(表6-7),均在缓殖子中表达上调(P<0.01),表达差异有统计学意义。6.7 PRU株弓形虫中的新miRNA和其特征将速殖子小RNA中的465749条未注释的小RNA和缓殖子小RNA中的400264条未注释小RNA,在目前ToxDB的三型(TgGT1、TgME49、TgVEG)弓形虫genome背景下,用Mireap软件预测新miRNA(图6-17)。经预测发现速殖子中有24条新miRNA,缓殖子中有214条新miRNA,有13条miRNA在速缓殖子中共同表达(图6-18)。其中,9条miRNA在缓殖子中上调(P<0.01),表达差异有统计学意义。4条miRNA在两个样本中均衡表达(图6-19,表6-8,表6-9)。在缓殖子期特异表达有168条miRNA(P<0.01),在速殖子期特异性表达有9条miRNA(P<0.01)(表6-10,表6-11),表达差异均有统计学意义。在PRU株弓形虫速殖子和缓殖子的新miRNA中,分别有50.41%和58.5%的miRNA的5’端第一个碱基偏向于“A”(图6-20)。PRU株弓形虫的225个新miRNA,依据其miRNA前体在弓形虫基因组上的位置注释,我们将其分为六类,在基因组上注释为UTR、intron、intergenic、exon的有19、6、37、84个,这四类miRNA的前体在3个弓形虫基因组上的注释类型唯一(图6-21)。另外,有7个miRNA的前体是跨着两个区域(表6-12),如外显子和内含子区、外显子和UTR区。此外有71个miRNA的前体在三个基因组上的注释不同,有两种或三种,详见(表6-13)。大多数新miRNAs的表达量<20(图6-22),仅有57条miRNA测到有miR*(图6-23)。大多数新miRNA在三个基因组上均能预测到其前体存在,而有少数miRNA被发现存在多个前体,如novelmir122有16个前体,novelmir40有9个前体,novelmir165有8个前体位置(Table 6-14).6.8 PRU株弓形虫miRNA与植物miRNA比较发现与已知藻类2条niRNA在seed区一致的3条miRNA(表6-15)6.9 PRU株弓形虫内保守miRNA分析PRU弓形虫miRNA中8条miRNA与已知miRNA seeds区完全相同(表6-16)在新miRNA中,有4对序列特殊的miRNA,每对miRNA的成熟序列几乎完全一样,分别来自速殖子和缓殖子,来自速殖子的miRNA都在其3’末端较来自缓殖子的另一个miRNA多了一个碱基。每对miRNA所预测的前体的位置也是完全一样仅是一个碱基差别(表6-17)。速殖子中的novelmir229较缓殖子中的novelmir198表达上调,而其余3对,缓殖子中的novelmir83、novelmir64、novelmir137相比较其对应的速殖子的 novelmir221、novelmir220、novelmir225表达明显上调(P<0.01),表达差异有统计学意义。PRU弓形虫niRNA中seeds区完全相同的有3组miRNA(表6-18)6.10新miRNA的靶基因预测鉴于目前还没有PRU株弓形虫专用的mRNA数据库,我们将以已知所有弓形虫ToxoDB5.2版所有注释和全长cDNA为预测靶基因数据库(Full parasite: http://fullmal.hgc.jp/)。PRU株弓形虫速殖子的24个新miRNA预测到的靶基因的数目为234138个,PRU株弓形虫缓殖子的214个miRNA在以上数据库中所预测到的靶基因有2114530个。由于这些海量的靶基因是的涵盖所有弓形虫株,我们先对其进行整体水平的功能分析。6.11新miRNA的靶基因预测及总体GO、KEGG功能分析速殖子24条新miRNA的预测靶基因的GO分析显示,7个分子功能(molecular function) term在这些靶基因中明显富集,见(表6-19)所示。速殖子GO分析(i)作用于酸酐的水解酶活性(hydrolase activity, acting on acid anhydrides); (ii)作用于磷酸酐的水解酶活性hydrolase activity, acting on acid anhydrides, in phosphorus-containing anhydrides;(iii)焦磷酸酶活性(pyrophosphatase activity); (iv)偶联的ATP酶活性ATPase activity, coupled; (v)肽酶活性(peptidase activity); (vi)作用于含有左旋氨基酸肽的肽酶(peptidase activity, acting on L-amino acid peptides); and (vii)催化活性catalytic activity.缓殖子214条新miRNA的预测靶基因的GO分析显示,结果中所有分子功能(molecular function)、所处的细胞位置(cellular component)、参与的生物过程(biological process)的term均未在靶基因中明显富集。速殖子和缓殖子miRNA靶基因的KEGG分析也未见有明显通路的富集。6.12弓形虫种内保守miRNA分析在RH株速殖子和ME49株速殖子中保守表达的miRNA有6条((表6-20)Fig6-21)法国Braun报道的(tg-miR-24a-3p, tg-miR-49b, tg-miR-61-5p, tg-miR-61-3p tg-miR-62* and tg-miR-24a-5p)和吉林Wang报道的(novel-45-3p, novel-14, novel-1-5p, novel-1-3p novel-41 and novel-15)。可见,miRNA的物种进化保守性也在弓形虫体内有所体现。综合分析发现弓形虫保守miRNA在不同基因型速殖子中表达方式和趋势有差异(6-24),在不同宿主细胞和生长环境中的同一基因型弓形虫速殖子保守miRNA的表达方式和表达量有差异。结论1.首次用Solexa高通量测序技术将PRU株弓形虫速殖子和缓殖子中小RNA组进行测序,并应用目前已完成测序的人和小鼠的基因组对两个小RNA组数据分别进行归类分析以去除宿主干扰。2.在已有的弓形虫基因组数据库(http://toxodb.org/toxo/)基础上,对PRU株速殖子和缓殖子小RNA进行标准化分析,发现2个已知miRNA和225个弓形虫新miRNA,且有182个niRNA在速殖子和缓殖子中的表达有差异。3.24个速殖子miRNA靶基因的GO分析支持以下结论:速殖子中miRNA可能参与抑制其本身物质能量的分解代谢。4.综合已知弓形虫种内保守miRNA的表达方式、表达差异和PRU株速殖子和缓殖子体内miRNA的差异表达和miRNA的功能分析结果,miRNA极其可能在速殖子和缓殖子相互转化过程中发挥了重要的调控作用。