论文部分内容阅读
自从达尔文的《物种起源》以来,在人类不断探索各种有机体奥秘的过程中,分子生物学在其中发挥了不可或缺的作用。在这一门学科的研究工作中,我们所获得的成果向我们展示了一个全新的微观世界,在里面我们清楚地看到了生物基因的序列和结构,基因在有机体中发挥的理化功能,在整合这些信息的基础上我们所了解到的生命过程的根本——比如说生命体的发育繁殖,我们称之为生命过程的基本机制。在我们研究的从微观生物到宏观生命体的所有生物机体中,尽管他们从生物学的角度讲差异巨大,但从基本机制的角度讲都是相同的。通过对生物体进化过程的研究表明,生命中许多重大的秘密都隐藏在它所属的物种的进化过程中,因此,我们将解开生命秘密的期望注入进化生物学的研究中,这门学科因此获得了旺盛的生命力和蓬勃的发展后劲。
得益于进化生物学所受到的重大关注,生物的基因序列和DNA序列的研究工作取得了长足的进步,产生了海量的生物序列数据,人类步入了后基因组时代。这种新的发展形势也使得基于生物实验的工作成果的获得变得杯水车薪,跟不上研究和社会发展的需求,于是,基于计算机技术与生物技术结合的生物信息学(或者称为计算分子生物学)便应运而生。生物信息学的研究领域广泛,其包括了对生物序列数据的测量以及将它们数字化以适应于计算机的处理要求,这就包含了对序列和结构表征方式的测量、基于序列和结构数据的特征向量的获取、基于序列和遗传信息的系统发育树的建立等重要内容。本文围绕着蛋白质功能的预测算法的开发这个中心,从对氨基酸残基序列的特征向量的提取,到系统发育树的建立和推断展开了研究工作。基于这样的研究,在系统发育树和数学的统计推断理论的基础上,提出了两种有效的蛋白质功能预测的方法,并与此领域相关研究成果进行了理论和实验效果上的比较,验证了我们提出的算法的有效性。