论文部分内容阅读
随着人类基因组、模式生物基因组计划的蓬勃发展,越来越多的生物全基因组已完成了测序。有理由相信数据的海量积累预示着理论的重大突破,然而数据并不等于知识,如何从冗长的数据中提取有用信息成了当前的一个热门课题。Z曲线是直观研究基因组序列的有力工具。基于Z曲线理论,基因组序列可以由一条等价的三维空间曲线唯一代表,从而使得人们对该基因组的整体和局部特征可以一目了然。Z曲线理论是本论文的理论基础,在文中的第三章里面对Z曲线理论作了简要地介绍。Z曲线理论有着广泛的应用,本文主要提出了一种以Z曲线变量为基础的进化分析新方法,并且应用此方法对各种冠状病毒之间的亲缘关系进行了一系列的分析研究。论文的第一部分为绪论部分,主要介绍了生物信息学发展的背景和主要研究内容,以及一些在本论文中将要用到的生物学知识。论文的第二部分对表形进化和分子进化研究进行了一些简单的介绍。同时介绍了分子进化中的一些重要理论、概念,以及研究中所使用的部分软件、建树方法以及单基因分子进化研究中所遇到的一些问题。论文的第三部分为本论文的核心内容,主要致力于提出以Z曲线变量为基础的进化分析新方法,并且使用该方法对冠状病毒尤其是不同时期不同病原体的SARS冠状病毒和类SARS冠状病毒进行了一系列的进化分析。全基因组序列数据的积累,使得不同生物之间的进化关系可以从分子水平上进行研究。不同于以往单纯依赖于生物形态学特征,这种分析更加深刻更加本质。与之前的分子进化研究方法不同,本方法以基因组全部编码蛋白质基因序列作为数据集,从而成功的避免了表型分类和单基因分子进化研究中所遇到的种种问题。应用本方法对各种冠状病毒的亲缘关系分析以及SARS冠状病毒和类SARS冠状病毒之间的进化过程分析都取得了令人满意的结果。这些结果清楚的反映了SARS冠状病毒与原有冠状病毒之间的亲缘关系,同时也揭示了类SARS冠状病毒和SARS冠状病毒之间的进化过程。本方法经过反展完善之后,将可以应用于基因组更大更为复杂的物种的亲缘关系研究。此外在本章的结尾部分还介绍了我们分别使用冠状病毒RdRp基因序列和全部编码序列的密码子使用率对以上两项亲缘关系分析所进行