LSS-DCA:一个快速的分治多序列对齐算法

来源 :浙江大学 | 被引量 : 0次 | 上传用户:zhugege521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着后基因组时代的到来以及一些新的高通量信息提取技术的开发,DNA和蛋白质序列数据库中的信息量以爆炸式增长。生命科学研究已经进入了深深依赖计算机和网络的时代。在所有的计算机工具中,多序列对齐占据核心地位。因为其它的许多生信息学工具都是以多序列对齐为基础的。由于序列对齐是一个NP完全问题,所有企图快速产生最优化对齐的想法是不可能实现的。所以,那些取得对齐质量与对齐时间最佳平衡的程序就是好的多序列对齐程序。分治对齐方法(DCA)就是这样一个比较好的程序。 由于序列对齐的计算复杂性相对于序列长度成指数形式增长,所以将长序列集分割成短序列子集的DCA思路可能产生快速的多序列对齐。首先,DCA将原序列集在中点附近切断,得到两个含较短序列的序列子集。重复这个处理过程直至得到充分短的序列集而能轻易的被对齐;接着,最优化对齐这些短序列子集;最后,通过连接对齐矩阵,得到全序列的对齐。DCA的关键问题就是如何计算这些分割点。实际上,DCA程序以一种贪婪方法计算分割点,而不能使DCA程序没有预期的快。 在本文中,我们提出了一种新的多序列对齐算法LSS-DCA。LSS-DCA结合了DCA方法和渐近方法的优点,达到了计算速度和对齐质量的较好平衡。LSS-DCA采用了一种简化的但十分严格的渐近方法来计算序列中显而易见的最长相似片段(LSS)。并在LSS两端切断序列集,LSS两边的短序列集重复进行相同的处理过程,直到所有的LSS被找出并被对齐。最后,以原序列集中相对应的序列片段或空格填充LSS之间的空隙,得到全序列集的对齐。 这种严格的渐近算法十分可能导致不能发现序列集中的相似片段,这将导致DCA过程不能进行下去。为尽量避免这种失败,一种纵向的分治(相对前面的沿序列的横向分治)被用来对原序列集进行聚类,将序列集分成多个关系更紧密的子集。这种聚类过程也是重复进行的,直至所有的序列被归入相应的类而适合横向DCA处理。两种DCA是交叉进行,但横向DCA具有更高的优先级。只有在横向DCA无进行下去时(找不到LSS),才进行纵向DCA并对得到的所有类进行横向DCA。一种极端情况就是所有的序列都是低相关性而每一条序列被归到不同的类中。在这种情况下,LSS-DCA的策略就不起作用,只采用ClustalW对齐序列。 我们用Visua1C+十开发了基于LSS一DCA思想的计算机程序,并测试了LSS一DCA程序的计算时间和内存要求。用几个序列数据对LSS一DCA程序进行验证,对齐结果与其它的6个对齐程序进行比较。结果表明,LSS一DCA快速产生质量较好的对齐,但对含有两个以_E相似的相似片段的序列集的对齐不理想。此外,LSS一DCA对内存的要求也较高。
其他文献
在新能源并网和智能电网发展的大背景下,本文针对公路供电中的负荷特点,对分布式储能系统形式进行改进,提出了一种以负荷为中心的分布式储能网络,以分布式储能节点对分散负荷供电
目的 探讨创伤骨科中骨折固定的临床方法 与效果.方法 选取所在社康医院的29例创伤性骨折患者,回顾性分析患者的临床资料,根据骨折固定方法 分组,观察组14例患者采用髓内钉固
目的 探析低位小切口甲状腺切除术治疗甲状腺结节的疗效.方法 选取我院于2017年10月~2018年12月在我院接受治疗的50例甲状腺结节患者作为主要对象,采用数字随机表法分组,每组2
目的 观察不同硒浓度和膳食结构对糖代谢的影响,探究膳食结构与硒对糖代谢的影响.方法 选用6周龄Wistar大鼠150只,雌雄各半,随机分为15组,每组分别给予3种硒浓度和5种膳食结
采用了以下三个实验来验证我们的设想.1.单纤维记录来自CCI大鼠损伤区及相应DRG胞体的ESD,应用有机和无机阳离子中和膜表面负电荷,观察ESD是否被抑制;用唾液酸酶处理膜表面以
钢珠产品在自动化生产过程中会产生各种各样的质量问题,需要在瑕疵检测环节加以去除,以保证产品生产的顺利进行。利用机器视觉技术进行产品表面瑕疵检测,能有效的提高检测工
目的 研讨激光治疗联合VEGF抑制剂对糖尿病视网膜病变患者疗效及预后的影响.方法 将我院收治的60例糖尿病视网膜病变患者采用盲选法进行分组,分成试验组和对照组,对照组:采取
目的 探讨神经导航辅助脑内血肿穿刺术对幕上高血压性脑出血合并脑疝征象的治疗效果及安全性.方法 2015年7月至2018年12月选取山东大学齐鲁医院(青岛)符合纳入标准的33例患者
圆极化天线和多波束天线在卫星通信、导航、雷达、无线通信等领域具有重要的应用。本文基于基片集成波导(SIW)和半模基片集成波导(HMSIW)技术对高性能圆极化天线和多波束天线
目的 探讨聚乙二醇电解质散(PGEP)在妇科腹腔镜术前肠道准备中的应用效果.方法 选取2019年2月至2019年5月行妇科腹腔镜手术的患者80例,采用随机数字表法分为两组(研究组和对