面向生物信息学的可重构计算技术研究

来源 :中国科学院计算技术研究所 | 被引量 : 1次 | 上传用户:alyue_wang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人类基因组测序工作完成后,对基因数据的处理和分析能力提出了更高的要求。计算是生物信息学的基本研究方法之一,其算法的特点是数据量较大、算法比较简单、运算类型单一、重复性较强、潜在的并行度较高。用现有的大规模并行机或超级服务器等通用系统解决这些问题,既浪费系统的资源,使用维护也比较复杂,有些问题甚至无法在限定的时间内完成。可重构计算就是一种行之有效的解决方案,这种解决方案不仅能够有效地对一些最常用的算法进行加速,而且能够快速适应算法的变化。本文的工作紧密结合面向生物信息处理的专用计算机系统这一项目的需求,分别基于PCI-X总线和DDR SDRAM总线设计实现了两种比较通用的算法可重构加速卡,并讨论了DDR SDRAM接口设计、PCI-X接口设计、ZBT SRAM接口设计等内容。在算法的硬件实现方面,本文系统地讨论了两条序列相似性的比较问题,详细阐述了编辑距离的原始算法和化简的方法以及从算法到逻辑的映射方法,根据这一方法提出了一种简单而高效的处理器单元(PE:Processing Element)的设计方法,并在此基础上进一步实现了脉动阵列的设计和完整的编辑距离算法核心处理逻辑电路设计。基于Altera公司的FPGA—Stratix lS30,本文在加速卡上设计实现了3072个PE,其工作频率限定为133.3MHz,峰值计算能力为409.6GCUPS(Giga Cell Update PerSecond)。加速比测试结果表明,与通用CPU相比,在序列比较长时(数十K对数百K长度),该卡最高可以得到3000倍以上的加速比,即使是在序列长度为几K时,也仍能取得两个数量级左右的加速比。在实际的应用中,本文利用硬件加速卡对多序列联配程序ClustalW的第一个计算步骤——序列两两最优联配过程进行了加速。测试过程中使用了随机生成的长度为3Kbp的序列,当序列的数量在100~1000条范围变化时,多序列联配的整体加速比与序列的数量基本上成正比关系,在这个范围内最高可以得到近35倍的整体加速比,显示出了硬件加速卡在实际系统中的良好的应用前景。在此基础上,本文又提出了一种面向蛋白质序列的局部联配算法的PE设计方法,该设计可以重用编辑距离算法的实现中的总线接口和片上控制逻辑,通过简单升级加速卡上的FPGA芯片就可以实现500倍以上的加速比。最后,作者对全文进行了总结,介绍了下一步的工作,并指出了将其他类型算法映射到该加速卡上的可行性。
其他文献
云计算平台大多基于虚拟机技术,在云计算平台上运行的应用程序性能又相当部分取决于平台虚拟机之间的I/O性能。因此,高性能网络连接,如10G以太网,已经开始部署在云计算平台中。而
本文研究了内容分发网络中代理服务器的选择放置问题,希望通过将内容分发到最适合的边缘代理服务器上,来更好地调整内容分发网络结构,降低用户访问延迟.本文将网络拓扑上的多
本文进行了以下工作:第一、为了使抽取出的关键词能覆盖文章的要点,本文首先进行文章子主题信息提取工作,在比较了各种方法之后,本文将TextTiling算法应用到隐式章节划分中.
本文研究了基于良性蠕虫的蠕虫对抗方法,讨论了良性蠕虫扩散所需遵守的基本原则,并在此基础上重点讨论良性蠕虫有效的传输策略,使其在可控的范围内传播,而且尽量减少这一过程
首先,本文系统地综述了视频水印技术的主要应用领域、区别于图像水印的特性以及国内外研究现状,并深入分析了一些典型的视频水印算法,特别是对几种传统的基于DCT域的视
网络安全是目前人们关注的一个热点,而安全协议的安全性却是网络安全的关键。安全协议应用于网络上传送文件和进行各种交易以及对计算机系统的访问等。人们已通过不同的方法
本文设计并实现了一个相对通用的模糊专家系统.该模糊专家系统的核心是由基于正向数据驱动型权值法不确定推理策略实现的模糊推理机和对模糊知识库的管理与维护两部分组成.此
本文根据弯曲木加工过程中的非线性因素众多,精确数学模型难以建立的控制特点,提出了将模糊控制和神经网络控制两种智能控制技术应用于弯曲木成型加工机械人控制系统中,并取
本论文研究小波变换在极低比特率视频编码中的应用,从以下两个方面进行研究: 第一,论述了小波的基本理论,特别是多分辨分析的原理,导出了离散正交与双正交小波滤波器的实
本文先就有关血管轮廓提取的方法进行分析,并根据对颜色模型的分析结合舌下图像的颜色特征进行提取方法的选择。 本文分别从图像处理和模式识别角度考虑的舌下静脉提