基于距离矩阵的进化树构建方法研究

被引量 : 0次 | 上传用户:jayleardutt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
系统发育分析是生物信息学中的重要研究领域,它的主要研究手段是从一组同源的DNA或蛋白质序列出发,计算各个序列之间的进化距离,从而得到反映物种进化关系的进化树。进化树通常是一棵二叉树,树的叶节点,代表了某个具体序列;树的拓扑结构表示了各物种之间的亲缘关系远近;树的分支长度刻画了进化距离的大小。构建进化树的方法主要分为两大类:基于距离矩阵法和基于特征法。其中,距离矩阵法以结构简单,具有良好的理论基础等特点获得广泛应用。基于距离矩阵法是构建进化树方法中比较常用的一类方法,但是传统的基于距离矩阵法是建立在序列比对基础上的。所以本文为了解决这个问题,提出了两种新的方法,这两种都是不需序列比对,而且比较直观,计算量小,通俗易懂。两种新方法是:基于改进的模糊聚类传递闭包的距离矩阵法和基于改进的k近邻距离矩阵法。基于改进的模糊聚类传递闭包的距离矩阵法是在原始的非相似距离矩阵上通过改进,得到一个新的相似距离矩阵,这个新的相似距离矩阵是反映物种之间相似度高的矩阵,然后在新的相似距离矩阵基础上利用了模糊聚类中的传递闭包法构建进化树。基于改进的k近邻距离矩阵法是建立在k近邻法和图论的基础上提出来的。这种方法是在原始的距离矩阵基础上找出每一行的k个最相似的分类群,然后用线连接起来,如果出现回路,则删除回路中距离最大的那条边,通过构建的一个最小连通图,利用聚类的思想构建物种之间的进化树。这种算法主要是k的选择问题。如果k过小,那么该图就不是一个最小连通图,而且存在孤立的边;如果k过大,那么该图会变得复杂化,计算量会增加,相应地,时间复杂度和空间复杂度都会增加。评估构建进化树的方法可行性,通常是采用PHYLIP软件中的Neighbor.exe程序来评估的,通过做实验来验证算法的可行性。
其他文献
随着生活质量的提高,人们对绿化的需求也逐渐提高,对生态环境的关注和重视达到一种前所未有的程度。但是城市规划中的绿化面积只是"见缝插绿",而且面积也越来越少,包括教学用
经过多年的发展,我国烟草机械水平取得了很大的发展,但是,烟草机械的大部分关键技术还没有攻克,完全靠从国外引进,严重限制了我国烟草机械的发展。本文针对国内对烟支支撑装置研究
提出一种对已知外方位元素的立体影像实施灰度重采样生成核线影像对的方法,推导了核线影像与原始影像之间的严密几何关系,并利用一组摄于某山区的1∶3000比例尺实际航空影像
文章在分析遗传学实验教学改革现状的基础上,结合现代教育理论和遗传学实验教学内容的特点,论述了遗传学实验教学改革的基本思路,分析并探讨了在实验教学中培养学生技能的方
在全球气候变暖、极端天气频发的过程中,城市微气象以更快的速度恶化,给全球超过50%的人口的生活带来巨大影响,而且影响范围将进一步增大。城市微气象恶化最重要的现象是城市热
近年来,我国的合唱事业取得了长足的发展。中国合唱今天面对的问题,已不再是普及而是提高的问题,提高的关键就在于五线谱的全面推广使用上应用五线谱进行合唱读谱,已经成为中
文章对中美大学暑期学校的实践进行了比较,发现中美大学暑期学校在课程设置、时间安排、学分转换和互认、住宿、学费等方面存在不同。文章指出,开放的暑期学校应是我国高等教
当前,我国的烟草机械行业发展较快,摆脱国外关键技术垄断已经成为我国烟草机械发展的主要任务。本文针对现有的几种主流的烟支传送装置,包括德国HAUNI公司蜘蛛手机构、英国MO
提出了一种利用网格搜索法定位地球椭球面闪电位置的方法,在闪电可能发生的整个区域内寻找最适应解,通过采用多级网格搜索策略,计算结果将迅速收敛至最终解。分别用仿真数据