论文部分内容阅读
蛋白质是生物的重要组成部分,地球上任何生命体的蛋白质合成都是由密码子所介导。在64种密码子中,虽然有些密码子编码同一种氨基酸,但它们的使用频率却常常差异很大。人们对导致密码子使用偏好的因素进行了很多研究,但对于单核苷酸重复这一高突变因素所引起的密码子及密码子对使用频率的改变却知之甚少。 在本研究中,我们在53种细菌,68种古细菌和13种真核生物中进行了单核苷酸重复及密码子对使用偏好的全基因组调查。在将密码子使用偏好同密码子对使用偏好区分开之后,我们揭示了四种基本的单核苷酸重复的避让模式:密码子对中5-6个单核苷酸重复的强避让模式;C-G重复的密码子对(C-G对)比A-T重复的密码子对(A-T对)其观测值/期望值(o/e)要低;基因组的GC含量与包含单核苷酸重复密码子对的o/e值呈负相关,尤其是C-G对;在高度保守的基因中,C-G对表现出避免使用的偏好。 由于长的单核苷酸重复序列可能引起编码序列的移码突变,因此我们的结果与自然选择对长单核苷酸重复序列的负选择作用相吻合。而这些避让模式在所有生物界中都存在的事实更暗示了这可能是自然界的普遍现象。因此,长的单核苷酸重复序列可能在碱基组成,基因的遗传稳定性及基因功能中都扮演着重要的角色。