论文部分内容阅读
核仁小分子RNA(smallnucleolarRNA,snoRNA)是一类代谢稳定、富集于核仁区的小分子RNA。snoRNA不仅指导rRNA和snRNA的甲基化和假尿嘧啶化,参与rRNA的剪接成熟,而且还参与一些mRNA转录后的化学修饰和选择性剪接。在小鼠中大多数都是内含子编码的。根据早期的估算哺乳动物中会存在200余种的snoRNA,主要是boxC/D和boxH/ACA两类snoRNA。但目前在哺乳动物中有将近400种snoRNA被鉴定出来,虽然有些分子的序列有些相似。这400余种的snoRNA中有相当一部分的snoRNA的功能是未知的,被称为orphansnoRNA。OrphansnoRNA中有一小类是印记表达(imprinted)的,即根据父母来源来决定表达与沉默的snoRNA。这些特殊的snoRNA被发现与很多疾病相关联,它们的结构,组织及其表达也是非常有趣的,现在已经证实其功能也对发育特别是神经发育相当重要。发现新的snoRNA,特别是具有特殊性质的snoRNA,比如印记snoRNA,并研究它们的功能具有重要的意义。也是该领域当前国际竞争十分激烈的前沿。
snoRNA分子因为功能的不同,拷贝数的差别可能以千倍计,简单地从总RNA出发构建小分子cDNA文库必然会非常频繁地出现高拷贝的分子。如果想寻找到并且研究新的snoRNA,即拷贝数相对较少的snoRNA,必然以大规模精细筛选或者大规模的测序为代价。随着在小鼠中的Rnomics计划的完成,通过小分子文库的方法寻找新的snoRNA是件非常困难的事情,由于Rnomics测序规模相当庞大,以rRNA和snRNA为靶分子的相对高丰度的snoRNA绝大多数已经被找到。大规模测序后仍旧隐藏的snoRNA一定是丰度极低的snoRNA,印记表达的snoRNA就是这类低丰度表达的小分子RNA。寻找新的印记snoRNA对于snoRNA的研究具有重要的意义,已经有结果表明它们与某些疾病密切相关。为了找到新的印记表达的snoRNA,本研究采用从DNA,即基因组数据出发的策略,通过计算机模式识别和EST比对结合实验分析的方法寻找新的snoRNA。
印记是只存在与哺乳动物和开花植物中的一种遗传现象。对双倍体的生物来说,每个基因位点的两个等位基因一般来说是同时表达的,并没有差别,尽管两个基因可能有显隐性的差别,印记基因是子代的等位基因根据其父母来源来决定表达与否的一类基因。印记基因大多数都是成簇的,这可能与簇里的几个基因公用一个IC(imprintingcenter)有关。据估算印记基因的数量可能占到人类蛋白编码基因总数目的1%,在小鼠中也是如此。目前研究得比较清楚的大约65个印记基因(反义重叠转录物未计入),它们大部分在几个簇中,很容易对它们进行位点分析,也使得获取基因间隔区序列变得有意义,也容易得到。通过文献和GenBank的注释,对小鼠所有的印记基因进行了定位。
通过程序(小部分通过手工)分别获取注释完善的和新的印记基因的内含子以及它们之间的基因间隔区,之后对这些序列数据进行snoRNA扫描分析。结果显示这些序列中有许多snoRNA特征序列,并且结构也非常好,其中出自内含子的序列一定是随着宿主基因一起转录的。这些snoRNA候选分子的分布并不是随机的,它们具有一定的偏好,这是snoRNA进化的一个结果,从一个侧面也反映它们并不完全是基因组的随机序列。本论文首先着重研究了位于小鼠12号染色体F1代的Irm基因的结构,Irm基因被认为与人类的一种神经紊乱有关联。它的十个内含子中,含有8个boxC/DsnoRNA-like的序列。有趣的是,有些内含子含有3个snoRNA-like序列,而到目前为止哺乳动物中尚未有成簇的snoRNA报道。Irm中编码的MBⅡ-426和MBⅡ-343以前被报道是大脑专一表达的,本研究的结果显示,这些snoRNA在大脑和睾丸中的表达量相对很高,除了肾脏外,其它的组织都有表达。这一结果也得到了Unigene数据的支持。Irm跟UHG基因很相似,外显子不具备编码功能,也有相对小的内含子(与蛋白编码基因相比),但与UHG不同的是,它不具有5TOP结构,而且内含子比UHG明显偏大。本研究还发现在Irm的下游有一个非常稀有的mRNA,它从未被报道过,它的结构,功能和表达有待近一步地研究。
目前为止在人类和小鼠中发现的印记表达的boxC/DsnoRNA已经超过十个,经过比较发现,这些印记的boxC/DsnoRNA具有很严谨的结构,这可能跟它们的成熟加工有密切的关系。所有的反义snoRNA都是内含子编码的,这暗示着snoRNA和它的宿主基因在表达调控和功能上有某这联系。1998年的时候,Smith等人发现snoRNA的宿主基因的mRNA都具有5TOP结构,那个时候的snoRNA都是以rRNA作为靶分子的。目前哺乳动物中功能未知的boxC/DsnoRNA,即orphansnoRNA有20多个,通过比较发现小鼠orphansnoRNA的宿主基因都不具有5TOP结构,这一发现是对snoRNA宿主基因的一个新的认识,也为orphansnoRNA功能的预测提出了一些线索。
本研究初期还采用小分子库的方法大规模地克隆筛选核仁小分子RNA。由于哺乳动物细胞中rRNA和tRNA占了RNA总量的绝大多数,任何cDNA的构建都不能忽略它们的存在。为了避免它们的干扰,本研究设想用细胞核里的RNA构建高效小分子cDNA文库。利用改良的柠檬酸-蔗糖梯度离心法获得了高纯度的细胞核,并提取了核仁。随后利用细胞核RNA构建了小分子cDNA文库,经过筛选测序,获得3个新的boxC/DsnoRNA候选基因,经过试验分析确证了它们的表达。
哺乳动物具有非常大的基因组,也有非常大的表达组(transcriptome),细胞组分相当复杂,例如脑中,脂类非常多,肝脏中糖原非常多。低丰度的snoRNA的Norhtern分析碰到的一个最大的问题就是上样量不能太多,否则因为杂质浓度也增大,样品变得非常粘稠,无法正常电泳。本研究实验过程中采用了富集小分子RNA的方法,很好地解决了哺乳动物低丰度小分子RNA的杂交和逆转录问题。