基于CUDA蛋白质结构比对算法的优化研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:shulin370
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物信息学是利用数学、统计学、信息学和计算机科学来研究生物学的问题的学科。它研究的一个重要准则是,结构决定功能。类似结构往往有类似的功能。当前已知结构的蛋白质数目远远少于序列蛋白质的数量,且已知结构和功能的蛋白质则更少。因而通过计算的方法,确定类似结构,推至功能是生物学信息学研究的重要内容。TM-align是一个有效的蛋白质结构比较工具,通过对其旋转和平移,找到最大的重合的部分的TM-score分数。算法涉及大量的TM-score计算。CUDA技术是一种统一的高并发的计算体系结构,可以有效的解决TM-score计算问题。研究成果包括:研究蛋白质结构比对算法的传统的实现方式,即使用传统的串行的CPU来进行结构比对算法;研究全局使用CUDA加速多个蛋白质结构比对算法,包括统一的计算方法和存储算法分离的方法;研究CUDA和CPU相结合计算方法,使得加速一对蛋白质结构比对成为可能;研究通过CUDA工具包调试优化存储和算法的方法。通过CPU和CUDA优化结果的对比,可以得出结论的是在同等计算效率下,在并行一定规模后(使用全局CUDA优化),或比对蛋白质的长度达到某个阈值之后(使用局部CUDA优化),GPU的计算效率比CPU计算效率要高。
其他文献
本文基于符号计算,研究了非线性数学物理中的孤子与可积系统理论。主要开展了三个方面的工作:在Conte展开验证法的基础上,对这一方法进行优化,总结出用截断不变展开法去求解实际
非线性偏微分方程的研究是当代非线性科学的一个重要方面,求解微分方程是一个困难但是非常重要的研究课题。目前,科学家们建立和发展了很多有效的,便捷的方法去求解非线性微
本文主要研究由保面积流和保长度流进行组合后形成的两种平面曲线流。首先我们考虑如下演化问题:令X(λ,t):[α,b]×(0,+∞)→R2是平面上一族闭曲线,X(λ,0)=X0(A)是一条严格凸
捕食者-食饵动力系统模型的定性研究是种群动力学中的一个重要研究领域.它在生态平衡,动植物保护,生态环境的治理,以及生态资源的开发利用等有着重要的理论和应用价值.国内外
至今对宇宙微波背景辐射,Ia型超新星以及大尺度结构的观测的结果都表明我们如今的宇宙正经历一个加速膨胀时期。为了解释这种现象,物理学家引入了一种新的能量概念——“暗能
生态系统中生物的捕食与被捕食行为是生态系统中的普遍现象。自上世纪Volterra和Lotka构造出捕食—食饵模型后,捕食—食饵模型就深受很多学者的关注。大多数学者都是在原有的
本文主要的工作是,利用无网格算法来求解几类双曲型电报方程的数值解。双曲型电报方程是一种应用广泛的偏微分方程,在电学,弹性力学,流体力学,声学以及微波技术等众多领域有
在对系外行星及恒星的探测中,传统的望远镜无法对系外行星进行直接成像,最主要的原因在于行星光的光强要远远小于其围绕的恒星光的光强。星际日冕仪(Stellar coronagraph)作为一
K+是植物生长发育过程中不可或缺的营养成分之一。植物对钾离子的吸收通常由根细胞质膜上的低亲和性K+转运系统和高亲和性K+转运系统共同完成。野生商陆是一种钾含量极高的植
多基因单表达载体的转化是基因工程研究的热点之一。本研究通过根癌农杆菌介导法,以卡那霉素作为筛选标记,利用植物表达载体p096899(含有BtCry1Ac和NTHK1)、p09687199(含有BtC