论文部分内容阅读
随着大量生物序列数据的不断被发现,特别是人类基因组计划完成以来,生物信息学作为一门新兴学科,受到了越来越多研究人员的青睐,该学科的研究重点是分析和处理生物序列数据,将其转化为对人类有用的信息。在本文中,作者将介绍运用非序列比对方法和距离方法,分别对30种细小病毒和70种多瘤病毒做系统发育分析,并构建出相应的系统发育树,获取有价值的信息。 本篇文章共分三个章节。第一章,主要介绍了生物信息学的基本概念、生物信息学的主要研究内容、生物信息学中常用到的数学方法以及本文研究对象病毒的相关理论背景知识。 第二章,本文提出了系统发生分析的理论知识:非序列比对方法和距离方法。在非序列比对方面,提出了处理序列的组分矢量方法,以及对组分矢量做进一步加工处理的动力学语言模型方法和Fourier变换方法;在距离方面,提出了关联距离方法、对数关联距离方法、互信息距离方法和Kullback-Leibler散度距离方法。同时对于这些方法的具体应用做了简单的介绍。 第三章,提出了采用选用两种不同距离方法相加权的形式,分别计算30种细小病毒和70种多瘤病毒的距离矩阵。细小病毒,选用了对数关联距离和互信息距离相结合的方法;多瘤病毒,选用了关联距离和对数关联距离距离相结合的方法。对于30种细小病毒的完全基因组DNA序列和蛋白质编码氨基酸序列以及70种多瘤病毒的完全DNA序列和蛋白质编码DNA序列运用PHYLIP包中的邻近归并(NJ)方法构建出系统发生树,得到了与传统系统发生树相一致的树,获得了比较理想的结果。 最后,对整篇文章做了简单的总结,对所运用的方法进行了评价,同时对于需要进一步开展的工作,也做了简要的说明。