多序列比对的统计模型及算法

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:zhuchonge
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多序列比对和系统发育分析是生物信息学的重要研究领域。通过多序列比对和系统发育可以预测新序列的结构和功能,分析序列之间的同源关系。提高序列的多序列比对准确率和重构合理的全基因组系统发育树是该领域的主要研究课题。本文对此进行了深入研究和探讨,主要研究成果如下:本文借鉴了ClustalW和T-Coffee算法,综合了渐进比对和序列间一致性策略的优点,提出了一种新的渐进多序列比对算法HMMPC。HMMPC先通过pair-HMM计算出每两条序列间每个残基匹配的后验概率,并结合其它序列的信息,得出每两条序列中每个残基的最终匹配后验概率,最后由这些后验概率值进行渐进比对。将本算法同ClustalW和T-Coffee等一些主流算法在BAliBASE库数据集上进行了比较研究。实验结果表明,本算法能有效地提高多序列比对的准确性。两条序列相似度的计算是渐进比对和系统发育树分析的基础,本文引入一种新的计算序列间进化距离的免比对方法—SimKMM。该方法利用了相对熵的原理,建立每条序列的Markov模型,最后,利用HMM的距离测度公式计算每两条序列间的进化距离,该函数计算简单、快速,且不需要人为设置参数,因此,能够更客观、有效地计算序列间的进化距离。用本算法对6条DNA序列进行了相似度测量,且将该算法用于DNA数据库搜索中,都验证了本算法有较好的实用性。
其他文献
随着PDA的广泛使用,传统的C/S计算模式已经显露出明显的不足,移动agent以其对环境的适应性和自主迁移性,使得低内存、弱连接的移动设备在分布式计算中的应用成为可能。除移动agen
数据挖掘中面临大量的不完备信息系统,即可能存在部分对象的一些属性值未知的情况。不完备的数据可能使挖掘过程陷入混乱,导致不可靠的输出。其所表现出来的不确定性也更加显
近些年由于因特网和电子商务的发展,企业内部基于WEB和办公系统的信息量增长迅速,这些数据具有不确定的子类型和属性,包含复杂数据类型和复杂的引用关系,如WEB上的网页、各种
与传统中国邮路问题相比,对动态网络中国邮路问题的研究具有更为重要的现实应用意义,成为了智能交通系统、计算机网络通信等复杂应用领域迫切需要解决的问题。解决传统中国邮路
车辆路径问题是研究如何优化物流运输的核心问题。研究车辆路径问题对于降低物流公司的运输成本,提高物流公司的服务质量都有重要意义。本文重点研究了带时间窗的车辆路径问
随着云计算和云应用的兴起,特别是近年来社交网络的普及,使得关于云计算的研究越来越受到研究者的关注。由于云计算的设备一般都很庞大,其所消耗的电能也非常巨大,因此,云平
随着社会的发展,各方面对快速有效的自动身份验证的要求日益迫切。由于生物特征是人内在属性,具有很强的稳定性和个体差异,因此是身份验证的理想依据。而人脸识别与指纹,虹膜
随着电信市场的开放和通信技术的发展,各种类型的电信增值业务不断的涌现,成为了电信企业的新的增长点;同时,增值业务产业价值链也随着合作伙伴的出现,出现了深远的变化。在增值业
增强现实是把计算机生成的虚拟物体信息合成到用户感知的真实世界中的一种技术。基于视觉标识跟踪技术的增强现实系统是通过跟踪视觉标识综合使用显示技术、交互技术、多种传
并行处理技术已经引起了石油地球物理界的广泛关注,如何将现有地震数据处理模块快速,高效地移植到集群上已成为地震数据处理需要解决的重大课题。面向大规模、高精度并行地震