基于神经网络的多叉系统进化树构造

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:titan19871102
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
系统进化树的研究已经有很长的历史,它在分子进化与系统发育研究中起的作用也越来越大。系统进化树直观的反映出生物进化过程的顺序,有助于我们了解生物进化的历史和进化机制。传统系统进化树的构造分为两类,即基于距离数据的构造方法和基于特征数据的构造方法。这些方法产生的都是二叉树,二叉树能够直观的描述序列两两间的关系,但对多个序列之间的关系描述不够准确;同时在构造过程中Tie Tree问题的频繁出现,严重影响了进化树构造的准确性,这些都是困扰系统进化树构造的问题。 在人工神经网络理论被大量应用到生物信息学研究领域之后,大大推动了系统进化树构造方法研究进一步发展,特别是无监督自组织映射理论,为系统进化分析提供了很好的理论基础。近几年,神经网络已经在序列分析与序列比对领域得到了很好的应用,取得了不错的效果,特别是在对海量序列数据的分析和处理噪音数据方面优势明显。 本文围绕现有构树算法中存在的问题,利用神经网络原理,结合模式分类,提出一种新的称为MSOT算法的系统进化树构造算法,该算法通过自身学习能力,挖掘序列内在的关系,不局限于两两序列之间的对比,而是从整个序列组的角度出发,从整体上对序列进行聚类,在此基础上构造进化树。通过这些方法解决了现有基于距离的构树过程中出现的Tie Tree问题,同时解决了传统方法只能生成二叉树的缺点,使用多叉树更加准确的刻画系统进化。较好地解决了海量分子序列数据构造系统进化树的问题,提高构造系统进化树的准确率,为生物分子研究和生物进化研究提供一种更加合理有效的依据。 算法采用自组织神经网络对序列进行分类,通过网络节点的增长生成进化树,同时还通过设置适当的参数,优化进化树的分层及序列聚类。网络既可以生成一棵完全多叉系统进化树,也可以通过设定收敛极限得到指定层数的中间树,前者可以体现序列的整体结构,后者可以较好地描述各个序列所代表物种的祖先之间的关系,这是传统方法无法做到的。 通过计算机模拟对蛋白质序列组的系统进化树构造过程,验证了算法构造多叉系统进化树的可行性,并验证了算法在克服Tie Tree问题时的有效性,提高了进化树构造的准确性。通过对多组蛋白质序列组的实验表明,算法可以构造完整的多叉系统进化树,并且在变换输入顺序后,系统仍然能够得到相同的结果,克服了Tie Tree问题,聚类效果得到了很大改善。
其他文献
长期以来,电信企业大量而详尽的电信业务数据只被简单的应用在各种业务系统中,而没有被更有效的开发利用。随着电信市场的竞争日趋激烈,如何利用这些数据为电信业提供决策支持服
决策树方法是数据挖掘的重要方法,通常用来形成分类器和预测模型。决策树方法包含多种不同的算法,其中ID3算法是决策树方法的典型代表,是决策树生成最常用的具体实现方法,它利用
粗糙集理论是一种新的刻画不完整性和不确定性的数学工具。知识约简是粗糙集理论研究的核心问题之一。目前,粗糙集理论正在被广泛应用于人工智能、模式识别等很多领域。本文对
随着互联网和大型局域网迅速发展,网络带宽的不断扩充,给我们带来方便的同时也导致用户数与日俱增,传统的认证管理模式已无法满足大型局域网中用户对网络安全性、高效性和低成本
机器学习已经广泛应用到实际生活的各个领域。随着互联网的高速发展,每天有数以亿级的图像被上传,下载,给计算机视觉中的图像自动分类带来巨大的挑战。当今搜索引擎耗费大量的人
星空背景的景象生成技术是实现太空目标的识别与跟踪、导弹寻的、航天器飞行场景模拟、星敏感器星图识别等技术的关键技术之一。星空背景建模技术在军事、航空航天、遥感探测
Apriori算法是数据挖掘中最普遍的关联规则挖掘算法。但是在大型数据库或低阈值的挖掘中则会相当耗费时间,因为Apriori算法在数据挖掘的过程中有两个效率上的缺点,其中一个是需
近年来,能源的过高消耗是我国面临的一个严峻问题,节能措施已经迫在眉睫,利用能耗监控系统,能够科学方便地找到有效的节能措施,从而减少能源不必要的消耗和浪费。高校不仅是培养社
在过去的几十年里,随着计算机技术的进步,数字图像输入输出设备的发展和普及,以及功能强大的图像处理软件的开发,数字图像处理技术已经渗透到各个领域,制造出逼真的篡改图像
移动Ad Hoc网络节点的协作性是指节点参与网络服务的程度。缺乏节点协作性的节点主要表现为没有提供尽力而为的、正确的网络层服务,目前提出的各种移动Ad Hoc网络协议基本上都