论文部分内容阅读
硒元素是一种生命必需的微量元素,其在体内主要以硒蛋白的形式存在和发挥作用,与多种生理过程及重大疾病有关。目前,用生物信息学方法分析硒蛋白基因是硒蛋白研究的一个重要方向。硒蛋白的结构特征是硒蛋白生物信息学研究的基础,硒代半胱氨酸(Sec)由UGA密码子编码,Sec的生物合成需要mRNA中一种特殊茎环结构即SECIS结构和数种反式作用因子,如Sec-tRNA和硒代半胱氨酸合成酶等。目前,有关硒蛋白的研究主要报道于动物、少量原生生物、细菌和少数古细菌中,而有关单细胞真核生物的硒蛋白基因及硒蛋白合成过程中涉及的RNA元件的系统研究还没有报道。本研究主要通过以下方法进行真核生物硒蛋白基因及重要RNA元件的识别和分析:一、.Sec-TGA硒蛋白基因编码区的识别。首先输入数据识别出信号位点,然后构建包含TGA密码子的外显子,最后使用适合于硒蛋白基因的组装算法SelGenAmic识别所有硒蛋白基因。二、SECIS结构识别。通过分析已知的SECIS结构模型,用模式匹配和协方差共变分析的方法构建新的SECIS结构模型,在硒蛋白基因下游DNA序列中寻找可能的SECIS结构,并使用RNAeval计算其最小自由能。三、Sec-tRNA识别。输入完整的基因组序列,然后使用Secmarker软件识别Sec-tRNA,最后编写脚本对数据进行分析提取。本论文以137种单细胞真核生物的基因组及Est数据作为研究对象,进行硒蛋白、Sec插入元件和Sec-tRNA的识别分析得到以下结果:一、在单细胞真核生物中发现了800多个硒蛋白基因,其中部分绿藻、硅藻和金藻中的硒蛋白数量较多,而部分红藻、寄生单细胞真核生物中硒蛋白基因的数量较少甚至丢失。二、我们对硒蛋白家族进行分析还发现了多个新硒蛋白家族,包括Pdi_e,Prx_b和SymSel。其中Pdi_e含有3个Sec,并且有两个连续的Sec出现在该硒蛋白的编码区中,并和另外一个Sec一起形成了保守的UGUU的motif。三、由于使用经典的硒蛋白SECIS结构模型不能完全识别单细胞真核生物硒蛋白基因下游的SECIS结构,我们构建了数十个新的SECIS结构模型。四、新的SECIS结构模型的茎和环的碱基数可变范围比经典SECIS结构模型大,且发现单细胞真核生物的核心区域主要类型是TGAT,而经典的SECIS结构的核心区域主要类型是TGAC。五、我们发现符合新模型的SECIS结构主要分布于泛植物界的绿藻中。六、单细胞真核生物的Sec-tRNA与后生动物Sec-tRNA存在一定差异,单细胞真核生物Sec-tRNA的受体臂中9个碱基没有完全配对,存在错配的碱基对。七、在没有硒蛋白基因的物种中发现Sec-tRNA的相似RNA结构。本研究,首次给出了跨越SAR大类、泛植物界及隐藻和金藻的系统的真核生物硒蛋白的分布谱图。还发现多个新硒蛋白,其中在Pdi_e中首次发现两个TGA密码子存在于硒代半胱氨酸中的现象。同时,建立了一套硒蛋白RNA元件的识别及分析的方法。构建了数十个新的SECIS结构模型,其与经典真核生物的SECIS结构模型存在差异,并发现符合新模型的SECIS结构主要分布于泛植物界的绿藻中。除此之外,发现单细胞真核生物的Sec-tRNA和后生动物的Sec-tRNA存在差异,还发现在某些没有硒蛋白基因的物种中发现与经典Sec-tRNA相似的RNA结构,我们推测,它们是该物种硒蛋白合成体系逐渐失去功能后的残留。本论文通过对单细胞真核生物的硒蛋白基因及硒蛋白基因合成过程中涉及到的RNA元件进行系统和详细的分析,从而发现单细胞真核生物与其他后生动物之间的差异。为研究硒蛋白合成体系在真核生物领域的进化提供了理论基础和数据来源,为发掘含硒重要生物资源提供线索。