论文部分内容阅读
回文结构是一种旋转对称结构,它既有序列的信息,又有结构的信息。它广泛地存在于真核生物及原核生物基因序列中,并且在这些基因中发挥着至关重要的作用。也有研究表明,很多疾病与回文结构密切相关,如男性不育、白血病、神经纤维瘤和肥大性骨关节病等,这些疾病都是由于回文结构变异引起的。关于回文结构的特征和作用,到目前为止没有完全弄清楚,有待于人们进一步深入研究。对于一些物种的回文结构,我们研究了回文频数、回文丰度和回文密度等特征。另外,蛋白质折叠问题是分子生物学的重要研究问题之一,其中,蛋白质折叠速率成为近年来一个研究热点。目前,关于蛋白质折叠速率的研究大多数基于蛋白质的结构、蛋白质的环境以及氨基酸序列等,也有研究表明,mRNA序列中也可能携带影响蛋白质折叠速率的因素,我们注意到,从序列的角度来看,回文结构体现了RNA遗传语言的特征;从结构的角度来看,回文结构是构成RNA结构的基本单元。如果蛋白质折叠速率也被mRNA影响的话,很可能体现在回文结构中。基于此想法,我们分析了回文结构各种参量对蛋白质折叠速率的影响。具体内容如下:1.在NCBI中收集到全部冠状病毒的RNA信息,计算出每个序列的回文结构,分析了回文结构中回文频数、回文丰度、回文密度等特征量。结果表明,回文丰度值随着回文长度的增加而减小,短的回文结构多,长的回文结构少,并发现了个别病毒中一些特殊的长回文结构可能会影响到病毒的结构或功能。2.基于相关文献和几个小的蛋白质折叠数据库,收集到具有蛋白质折叠速率信息的蛋白质,根据PDB、EMBL和NCBI数据库之间的交叉引用,找到了相应的mRNA信息,计算出每个mRNA序列回文结构的回文频数和回文密度,建立了一个较大的包括回文结构参量的蛋白质数据库。3.分析了回文频数对蛋白质折叠速率的影响,结果表明,对于所有蛋白质,回文频数与蛋白质折叠速率之间呈负相关,并且长度为4的回文结构的回文频数与其相应蛋白质折叠速率有较显著的相关性;对于不同二级结构类蛋白质,混合类(α-β)蛋白质的回文频数与相应蛋白质的折叠速率相关性更好一些。按不同折叠类分类下发现,回文频数与多态蛋白质的折叠速率之间的相关性更显著一些。回文频数的大小反映了mRNA序列的复杂性,这种复杂性会影响到肽链的延伸速度,进而影响到蛋白质折叠速率。4.分析了回文密度对蛋白质折叠速率的影响,结果表明,对于所有蛋白质,回文密度与蛋白质折叠速率呈负相关;对于不同类蛋白质(二级结构类和折叠类),回文密度与蛋白质折叠速率之间的相关性有较大的差异。进一步分析表明,正是被多个回文结构同时使用的那些碱基对蛋白质折叠速率起到非常重要的作用,它们体现了mRNA序列的可变性,这种可变性影响了肽链的延伸速度,因此,使回文密度成为影响蛋白质折叠速率的重要因素。