基于FPGA的HMMer加速系统的设计与实现

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:vergillove
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
HMMer是广泛应用的生物信息学开源软件工具包,它提供了对基因和蛋白质进行分类与匹配的一系列工具集。P7Viterbi是HMMer的核心函数,由两层嵌套循环实现了计算密集型算法Plan7 HMM。虽然算法具有很强的并行潜力,但受限于CPU的串行本质,HMMer在常规平台上运行十分耗时。FPGA技术近年来有了巨大的发展,基于FPGA和CPU的异构系统得到了学术界的广泛关注,大量的学者正在对其计算能力、适用范围、开发流程、耦合方式、应用前景进行广泛的研究。FPGA-CPU异构系统可以发掘Plan7 HMM算法的并行性,目前主要有两类:(1)并行执行多个核心函数,(2)简化运算以实现对单个核心函数的并行运算。后者对单个函数进行并行运算,但运算的简化导致精度的下降。因此,本文在不简化运算的前提下提出了一种可以适应Plan7 HMM的数据依赖特性的基于脉动阵列的并行运算结构,并且使用PCI Express总线耦合方式实现了加速系统。本文首先总结了对HMMer进行加速的常用方法并分析其优缺点,并选择并行度较高、加速潜力较大的CPU-FPGA协同工作方式作为加速方式;分析了FPGA实现高性能计算的可行性和CPU-FPGA耦合方式的优缺点,并选择外部总线方式作为本文的耦合方式。其次,介绍了HMMer采用的Plan7 HMM的基本原理;对HMMer进行性能分析,从而确定对Plan7 HMM进行实现的P7Viterbi函数为系统的核心函数。然后,提出了适合数据依赖特性的并行运算的脉动结构,提出了并行数据提供方案来解决数据的并行访问,提出了运算切分机制来解决运算单元规模与计算规模不匹配的问题,提出了“自动重算”机制来解决阻碍计算并行的“回边”问题。再次,在FPGA实现过程中,应用并行化、流水化和参数化技术提高了系统的吞吐率和可移植性。最后,对系统的性能进行了分析并提出本文存在的不足与改进的方向。实验表明,本文所设计的系统具有很高的效率和很好的可移植性。当采用Virtex 5 110T芯片时,每个运算单元的平均加速比相对于奔腾4平台为4.4倍、相对于酷睿2平台为3.7倍,系统的平均加速比相对于奔腾4平台为109倍、相对于酷睿2平台为92倍。
其他文献
在实际的工程应用中,直接数字合成技术的输出指标主要受到相位累加模块,波形数据存储模块和数模转换模块等工作性能的限制。本文从直接数字合成技术的原理出发,针对数模转换
在双折射光纤中频率转换主要由参量放大和拉曼散射之间相互作用的竞争所决定的,基于此本文从小信号条件下斯托克斯波和反斯托克斯波所满足的耦合微分方程出发,考虑泵浦波是线
半导体低维结构所具有的独特物理性能促进了新一代半导体器件的发展。近年来,半导体共振隧穿及零维量子点体系由于在自旋电子学和量子计算中具有潜在的应用,受到人们广泛的重
社会排斥理论是欧洲社会政策研究中新兴的理论。欧盟一体化进程和福利国家危机是社会排斥理论发展的主要背景。社会排斥指社会成员愿意参与社会活动但是被不可控制的因素阻止
目的:建立芍药苷快速、灵敏的酶联免疫分析(ELISA)检测方法,并使用新方法检测中药材白芍中芍药苷的含量。方法:以制备出的芍药苷特异性单克隆抗体为基础,通过考察线性关系、
mRNA上能发生100多种化学修饰,其中N~6-腺嘌呤(m~6A)是mRNA修饰中最广泛的表观修饰方式之一。在细胞分化、胚胎发育和应激等生物学过程中,特定的mRNA会发生包括N~1-腺嘌呤甲
太监王振是明朝专权擅政、为害贻祸的三大太监之一。他少年入宫,起初谨守本分,勤诚益至,为诸帝信用。正统年间,王振掌司礼监,逐渐干政,成为当时实际统治者,英宗只是一个傀儡
电磁兼容测试作为3C认证中的一部分,是相关产品上市前必须进行的测试之一。在电磁兼容测试中,因为测试过程耗费时间较长、记录数据量大和程控设备的需要等原因,使用自动测试
近年来,光混沌保密通信逐渐成为信息安全保密通信技术领域的一个研究热点。由于半导体激光器(SL)在受到光注入、光反馈和光电反馈等外部微扰时容易产生混沌输出,因此基于SL的
物业服务合同纠纷案件不断增多,同一类型的纠纷案件,不同地区的法院在裁判时所依据的是不同的条款。在这样喷井式增长下,依据物业服务合同产生基础即建筑物区分所有权,物业服