【摘 要】
:
多序列比对是目前生物信息领域研究的重要课题之一,在基因识别、蛋白质结构预测等领域有着广泛的应用。由于问题本身所固有的复杂性,至今还没有一个令人满意的算法,同时随着
论文部分内容阅读
多序列比对是目前生物信息领域研究的重要课题之一,在基因识别、蛋白质结构预测等领域有着广泛的应用。由于问题本身所固有的复杂性,至今还没有一个令人满意的算法,同时随着生物数据的不断增长,串行算法已不能满足人们的需求。本课题重点研究了如何利用de Brujin图进行多序列比对及其并行化处理方案,提出了一个新的多序列比对并行算法PL_GAlign。课题的主要工作与贡献如下:在基于图论的算法中引入了距离参数并采用了改进的星形比对算法:详细分析了目前使用比较广泛的多序列比对算法,但是常用的并行划分策略对该类算法的执行效果较差。因此重点研究了基于图论的多序列比对算法并对其进行了改进:为了更好的适应基因的变异性,在该类算法中引入了距离参数d,将现有算法的精确匹配修改为允许一定误差的模糊匹配。在应用de Bruijn图得到中心序列后,摒弃了现有算法中常用的动态规划算法,采用了更为适合这种情况的星型比对算法并对其进行了改进,从而使该算法的时间复杂度降低至几乎线性。针对算法中的各个阶段提出了并行处理策略:针对多序列比对的高计算复杂性问题,研究了基于de Bruijn图的并行化处理方案。分别对基于图论的多序列比对算法中的构建de Bruijn图、去环、寻找最大权值路径和两两比对阶段的串行处理过程和可并行性进行了探讨,提出了各个阶段的并行处理策略。最后进行了一系列数据测试,实验结果证明PL_GAlign算法在运行速度上要优于现有的迭代法,尤其当输入序列较长且数目较多时,这种优势更为明显。在精度上略好于目前使用最广泛的CLUSTAL W算法。
其他文献
姜黄素具有广泛的药理作用,如抗炎、抗癌、抗氧化、抗阿尔茨海默症、抗HIV等。为了开发药用价值更有效的化合物,通过对其构效关系的研究,设计并合成了一系列姜黄素类似物。姜黄
自从新课程改革实施以来,农村小学语文教学方法已得到不少的改观,但在讲读课文的教学中,还有许多陈旧传统教学方法没有打破。针对此现状,为了充分调动农村小学学生学习的积极
人类的视觉是一套复杂而精密的系统,具有察觉、分辨物体的能力,并能分析和判断物体的结构、姿态及运动,从而在复杂环境中自由、安全地行走和活动。随着现代科技的发展,特别是
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食
Back to yield
数据流管理技术的研究已成为信息处理和数据库领域的热点和前沿,数据流管理技术可以为实时信息处理和分析提供有效的支持。随着电网规模的扩大和电力自动化程度的提高,电力系
目的观察黄芩素对人结肠癌细胞SW480移植瘤的生长及小鼠血清血管内皮生长因子(vascular endothelial growth factor,VEGF),肿瘤坏死因子-α(TNF-α)水平的影响。方法通过裸鼠前肢
基于内容的视频分析技术是解决当前信息超载现象的重要方法,已经成为多媒体分析领域的研究热点。本文的研究目标是模拟人类认知过程研究有效的视频内容分析技术,使用户可以在
一般意义的收入再分配仅指以公共部门为中介实现的从高收入者到低收入者的转移支付。论文所讨论的收入再分配是指不改变当期可支配收入总量下,对可支配收入在个人和家庭之间分
利用常规气象观测资料和区域自动站降水资料、micaps资料,FNL1°×1°再分析资料以及FY-2C卫星云图等资料,对2015年5月14~15日桂林市大暴雨过程及其成因进行了分
目的对腹股沟斜疝的患儿实施腹腔镜下疝囊高位结扎术与传统开放手术治疗的临床近期效果分析。方法本次研究选取本院40例腹股沟斜疝的患儿,以抽签的方式随机分为两组,治疗组给