论文部分内容阅读
生物信息学是一门新兴交叉学科,其研究涉及到数学、生物学和计算机等学科的知识.系统发生分析作为生物信息学的重要研究内容之一,主要是利用概率统计方法对生物进化关系进行推断和评估.在系统发生分析中常以概率置换模型来描述生物数据单元的进化过程.最初,概率置换模型是以核苷酸或氨基酸为数据分类单元的.20世纪90年代以来,结合核苷酸替换信息的密码子置换模型受到了越来越多的学者的关注,并得到了广泛的应用. 本文主要研究了考虑氨基酸相似性和密码子三个位置差异的密码子置换模型.考虑到将氨基酸的信息融入到置换模型中的可行性,本文第二章提出了两个基于氨基酸相似性的密码子置换模型,第一个模型考虑密码子中单个核酸位置的相继置换,第二个模型进一步包含了在一个密码子中三个核苷酸位置发生多于一个置换的情况.我们利用连续时间的马尔可夫过程来描述密码子间的置换,通过极大似然法对模型的参数进行估计,最后将新模型应用到三个真实的数据集,并与原有模型进行比较来分析新模型对数据的适应性.结果表明新模型对给定的数据集更具适应性,由此可以得到更可靠的参数估计值.在第三章中我们针对密码子三个位置上发生置换的差异性,进一步提出了区分不同位置置换的密码子模型,利用极大似然法对模型的参数进行了估计,并将新模型与原模型进行了比较.第四章研究基因转换偏向对正选择检测的影响.建立了基于基因转换偏向因子的置换模型,并由此探讨了基因转换偏向因子对进化选择性的影响.