论文部分内容阅读
内含子作为一类非编码RNA与1mRNA一起转录。许多间接证据暗示,剪接后的内含子和相应mRNA序列应该存在相互作用。我们认为这种相互作用体现在两者之间存在的序列匹配区域上,它们在基因表达调控过程中起着非常重要的作用。基于这一思路,采用Smith-Waterman局域比对方法得到外显子连接序列与连接处内含子序列的最佳匹配片段,研究了它们在外显子连接序列上的分布和最佳匹配片段的特征,并对其机制性的问题进行了探讨。主要研究内容如下:1.分析了27个物种的核糖核蛋白基因内含子与相应外显子连接序列之间的最佳匹配区域在外显子连接序列上的分布。结论如下:1)在匹配频率分布中,一些低等真核生物外显子连接处上游显示出了EJC结合的信息,高等真核生物则没有。序列分析显示,所有物种的EJC结合区域序列呈现出低的结构序或相对于外显子其它部分序列构成更加随机。表明EJC和内含子这两类调控元件在与外显子序列结合的过程中存在相互竞争和相互协作的关系。2)最佳匹配片段的平均长度约为20bp左右,配对率主要分布在65%-80%之间,少数片段的配对率达到100%。它们与siRNA和niRNA这两类非编码序列的结合特征是一样的。2.在全基因组水平上,分析了线虫,拟南芥和黑腹果蝇蛋白质编码基因的内含子与其相应外显子连接序列的最佳匹配频率分布。结果发现:1)在外显子连接处出有明显变化;第一内含子和与其它内含子的最佳匹配频率分布是存在差异的;长内含子和短内含子与相应外显子连接序列的结合强度是有差异的。表明第一内含子和长内含子有重要的生物学功能,揭示了内含子与其编码序列是存在相互作用的。2)最佳匹配长度分御的最可几长度均在20bp左右,最佳匹配片段的配对率与核糖体基因分析的结果一致。内含子与编码序列之间存在的最佳匹配片段也是RNA-RNA相互作用,最佳匹配片段的特征与miRNA和siRNA一致,表明这类相互作用应该具有生物意义。我们认为这些最佳匹配区域对基因表达调控起着重要的作用,内含子应该成为第三类RNA-RNA相互作用的具有功能的非编码序列集合。3.分析了线虫,拟南芥和黑腹果蝇基因组所有外显子连接序列中最佳匹配片段的GC含量,发现:1)所有序列与GC含量在0.31-0.50内的外显子连接序列的匹配频率的分布几乎一样;GC含量在0-0.3内,则外显子连接序列上游的匹配频率明显大于下游;而GC含量在0.51-1.0内,则外显子连接序列上游的匹配频率明显小于下游。2)将最佳匹配片段按照GC含量的不同分成三个组:GC含量小于0.3,0.31-0.50,大于0.50。发现GC含量在0.0-0.3内的序列D2值最高;GC含量在0.5-1.0内的序列D2值是最低的;GC含量在0.3-0.5之间序列的仍值介于前两者之间。这一特征对3个生物是相同的。表明低GC含量区域的序列具有更强的结构序,而高GC含量区域的序列结构序最低或序列的随机性更强。这一结果显示出外显子序列具有可区分的内部结构。总之,本主要研究外显子连接序列与连接处的内含子序列相互作用最佳匹配频率分布规律和最佳匹配区域的序列特征,得到了一些很有意义的结果。各种分析均支持内含子与外显子连接序列之间存在相互作用的论点。研究对于辨析内含子的功能具有重要的生物学意义。