论文部分内容阅读
生物信息学是利用数学、统计学、信息学和计算机科学来研究生物学的问题的学科。它研究的一个重要准则是,结构决定功能。类似结构往往有类似的功能。当前已知结构的蛋白质数目远远少于序列蛋白质的数量,且已知结构和功能的蛋白质则更少。因而通过计算的方法,确定类似结构,推至功能是生物学信息学研究的重要内容。TM-align是一个有效的蛋白质结构比较工具,通过对其旋转和平移,找到最大的重合的部分的TM-score分数。算法涉及大量的TM-score计算。CUDA技术是一种统一的高并发的计算体系结构,可以有效的解决TM-score计算问题。研究成果包括:研究蛋白质结构比对算法的传统的实现方式,即使用传统的串行的CPU来进行结构比对算法;研究全局使用CUDA加速多个蛋白质结构比对算法,包括统一的计算方法和存储算法分离的方法;研究CUDA和CPU相结合计算方法,使得加速一对蛋白质结构比对成为可能;研究通过CUDA工具包调试优化存储和算法的方法。通过CPU和CUDA优化结果的对比,可以得出结论的是在同等计算效率下,在并行一定规模后(使用全局CUDA优化),或比对蛋白质的长度达到某个阈值之后(使用局部CUDA优化),GPU的计算效率比CPU计算效率要高。