论文部分内容阅读
随着微生物基因组测序计划的深入发展,越来越多的微生物全基因组被测定。分析这些基因组中基因组分所蕴含的生物学信息是亟待解决的问题。不同微生物基因组GC含量差别很大,这种差别对基因及相应蛋白质的组分具有较大影响。另一方面,特定蛋白质为了保持其结构和功能,对蛋白质编码序列在单核甘酸、密码子、氨基酸和具有相同理化性质的氨基酸等不同层次上具有限制作用。分析基因组GC含量对蛋白质组分的影响对理解自然选择与碱基突变的关系以及微生物进化具有重要意义。对1732个微生物基因组序列进行统计、分析,结果表明在蛋白质编码中密码子不同位置碱基分布不对称。当基因组GC含量变化时,密码子第三位GC含量变化比第一位和第二位GC含量更显著。此外,密码子第一位,嘌呤含量较高,而碱基T的含量较低;密码子第二位,碱基G含量较少,密码子第二位碱基T含量维持在较高水平,且当基因组GC含量增加时,碱基T含量变化缓慢。基因组GC含量影响蛋白质编码序列中密码子的使用和氨基酸含量,然而碱基分布不对称性使氨基酸含量受到限制。此外,随着基因组GC含量变化,虽然不同氨基酸含量有很大变化,但亲水氨基酸和疏水氨基酸整体组分含量变化很小。这些结果表明,虽然基因组GC含量对蛋白质之中氨基酸组分影响很大,但是碱基分布的不对称性,对氨基酸组分有一定的限制作用。此外,结合其他同学的研究工作,本文利用LAMP建立生物信息学网站和生物信息学综合数据库。该数据库一方面整合了细菌复制起始点等相关数据;另一方面,整合了一个真核生物基因第一外显子的分析软件,可以对真核生物基因组序列在线处理。用户可以登陆http://10.1.25.220/bioinformatics/,免费使用。