基于序列结构信息的多序列比对算法研究

来源 :南昌航空大学 | 被引量 : 0次 | 上传用户:yan3134
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物信息学是以计算机为工具对生物信息进行储存、检索和分析的科学。序列比对是生物信息学中的一个基本问题,设计快速而有效的序列比对算法是生物信息学研究的一个重要内容。序列比对的一个基本方面是进行多序列比对,多序列比对是一个NP 完全问题。 在多序列比对中,构建指导树是一个非常重要的步骤,指导树拓扑结构的合理程度直接影响到多序列比对的准确率。因此,研究构建指导树近似最优算法有着重要意义。目前常用的构建指导树方法有三种,即距离法,最大简约法和最大似然法。针对距离法中的邻接法在指导树生成方面存在近似程度不高的问题,本论文运用寻找主结点的思想,设计了邻接法的改进方法,并应用到基于序列结构信息的多序列比对算法中。 已有的渐进比对算法一般是基于双序列比对来构建距离矩阵,而且需要人为设定参数,这种构建距离矩阵方法无法反映序列间的结构信息差异,因而难以客观、有效地反映序列间进化距离。针对以上问题,本论文提出了基于序列结构信息的多序列比对算法,此算法利用信息熵度量序列间进化距离。考虑到序列中相邻字符的相关性,该方法通过序列中相邻子序列分布来描述序列,并且可以从序列中提取有关组分以及结构等信息。同时,它具有计算简单、快速,且不需要人为设置参数等优点。以多序列比对基准数据库BAliBASE 提供的序列作为测试数据集,将该算法与ClustalW 等经典的多序列比对算法进行了比较研究。结果表明,该算法在不提高时间复杂度的基础上,有效地提高了多序列比对的准确率。
其他文献
图像处理重点学科网格是中国教育科研网格上的一个典型应用,其目的是建立以资源共享和协作为核心的、服务重点学科建设的基础性支撑体系。资源包括数据资源和计算资源。在传统
针对国内半导体行业的现状,确定以半导体生产企业的扩散炉温度控制系统为研究对象。根据传统的扩散炉温度控制多采用常规温度控制仪表,存在生产工艺控制能力、自动化程度及生产
XML(eXtensible Markup Language,可扩展标记语言)凭借其结构简单、易于理解、自描述、可扩展、可跨越系统平台等特性,现在已成为Internet上数据表示和数据交换的事实上的标准
随着计算机硬件和3D扫描技术的快速发展,通过建立体数据场的连续模型的四维空间数据体的造型研究已经成为科学可视化领域中的热点研究内容,其研究成果已广泛应用于计算流体力
随着无线通信技术和互联网技术的飞速发展,移动通信业务从以前的语音业务逐渐向数据业务过渡。虽然传统互联网技术己经使人们感觉到网络所带来的便利和乐趣,但它缺乏可移动性
推荐系统通过预测用户对项目的喜好程度为用户进行信息过滤,应用知识发现技术生成个性化推荐。协同过滤已经成为个性化推荐系统的一种主要工具,但在许多推荐系统中,每个用户
最近的技术进步孕育出了一种新的无线传感器与移动对象网络(WSANs),这种网络能够监测客观世界,收集数据,根据监测到的信息做出相应的反应。这些网络可以是战场监视系统,建筑
数据是信息的载体,数据的完整性决定了信息的存储和表达效果,然而数据在搜集和整理过程中经常会出现随机缺失,而且数据集在信息化时代的指数级膨胀也增加了修复补全的难度。本文
本文提出了一种全新的处理视频对象变形的系统。该系统的目的是尽可能的减少用户的交互,同时提供较高的灵活性和较精确的控制力。它具有基于关键帧的用户界面。用户仅仅只需要
随着互联网的发展以及Web2.0的出现,微博(Microblog)逐渐成为人们相互沟通、发表言论以及获取新闻的重要工具,因此及时发现微博中热点话题具有重要的现实意义。但是微博文本内容