DNA序列比对算法研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:acxyvpfag
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人类基因组计划(human genome projeet,HGP)是美国在1990年提出实施的一项伟大的科学计划,自那以后,人们已经获取了大量的DNA、RNA及蛋白质序列的数据,目前,生物分子数据量每15个月翻一番,这些生物分子数据具有丰富的内涵,其背后隐藏着人类目前尚不知道的生物学知识。   随着人类基因组计划(HGP)的开展,生物信息学作为生命科学的核心学科在不断的向前发展。序列比对是生物信息学中一个非常重要的研究内容,是基本的处理信息的方法。将大量累积的核酸和蛋白质序列进行比对,对发现生物序列的功能、结构和进化信息具有重要的意义。   如果两个序列具有足够的相似性,那么它们可能是同源的。两个同源的生物,其序列具有一定的相似性。如果一个新测定的DNA序列与一个已知的基因序列很相似,那么该基因序列含有与已知基因序列相似的结构和功能。因此,序列比对方法的应用对于基因结构和功能的研究具有较大的实际意义。   随着生物序列数据的激增,开发高效率的比对算法就显得非常迫切。本文研究了生物信息学中的双序列比对算法。首先介绍了生物信息学的基础知识和序列比对的数学模型,然后着重介绍了Needleman-Wunsch、Hirschberg以及Ukkonen三种经典的双序列比对算法,并在数值实验的基础上对它们进行了比较分析。最后,在Needleman-Wunsch算法基础上提出了一种启发式的改进算法。经实验表明,改进算法在一些应用条件中精度损失较小的情况下速度得到了较大的提高。当对同源序列所要求的同源相似度较高(如近亲物种)时,算法的速度提升很高,精确度损失也较小。
其他文献
空间数据查询方法是在空间数据库、空间数据挖掘、空间拓扑关系分析、智能交通和地理信息系统等领域扮演着非常重要的角色。最近邻查询方法作为空间数据查询中的一个分支,在
随着航空运输的快速发展和飞行流量不断增加,空中交通变得越来越繁忙和复杂。由于我国空域改革相对滞后,空域结构不尽科学,管制人员需要对大量的飞行活动不断进行调整。同时,全天
随着人类基因组计划和各种模式生物基因组计划的相继完成,生物信息学的研究重点已经从生物数据的积累转变为对生物数据的整合处理,以异构生物数据整合为核心的生物信息分析系统
近年来,国内很多高校都进行了以按需设岗、按岗聘任、以岗定薪、优绩优酬为主要内容的人事分配制度改革的工作。这也在很大程度上调动了高校教师的工作积极性,推动了高校师资水
无线传感器网络作为一种新兴的数据获取技术深入影响着人们的工作和生活,得到国内外研究学者的广泛关注。采集获取数据是无线传感器网络实现其监测感知功能的关键组成要素。
近年来,随着计算机的普及与信息化的发展,中文信息处理技术的应用日益广泛,中文自动分词技术是中文信息处理的基础,已应用在文本校对、机器翻译、文本分类、自动摘要、信息检
人耳识别是一种比较新的生物特征识别技术,它是根据人耳生物特征进行身份识别。人耳识别既可以单独应用于一些个体识别场合,也可以作为其它生物特征识别技术的有益补充。人耳
语言本身的灵活性和复杂性使得对机器翻译的译文进行质量评价变得非常困难。早期的译文质量评价方法主要采用人工评测,这种方法得到的评价结果通常具有较高的准确性,但同时却
计算机和互联网技术的快速发展,给人们的办公和生活带来了极大的便利。在人们越来越依赖于计算机的同时,以计算机为对象或工具的计算机犯罪也日益猖獗。计算机犯罪严重的危害
机会网络作为一种新型的移动自组网,源于容忍延迟网络,主要由智能手机、PAD等手持设备以及各种交通工具等携带的移动通信终端通过自组织方式构成。由于机会网络通常不依赖于