面向流式应用的粗粒度可重构计算技术研究

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:a1133e43
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现代科学研究对高性能计算机的依赖程度越来越高。当应用程序的计算、访存和通讯特征和目标硬件平台不匹配时,通用高性能计算机的实际性能会大为降低。专用高性能计算机系统以分析应用程序特征为基础,通过各种权衡和取舍,可以达到和应用程序特征的匹配。面向领域的高性能计算机研究是目前系统发展的重要趋势之一。   流式应用程序具有广泛的应用背景。本文选择流式应用程序作为专用高性能计算机的研究对象,重点分析了两个典型应用程序:冷冻电镜三维重构和高通量基因序列比对。通过提取计算模式和访存模式,设计加速器部件和内存控制器,实现了对应用程序中热点区域的有效加速。   本文系统地研究了一种面向流式应用程序的可重构加速器结构,包括粗粒度计算流并行优化、内存予系统、计算模块自动化生成等关键技术。在一款自主研发的FPGA加速卡上进行了工程实现,通过和商用多核处理器以及GPU的性能比较,证明本文提出的加速器结构有明显的加速比和功耗比优势。   本文主要研究成果如下:   1.提出一种面向流式应用的粗粒度可重构加速器结构。   2.为了提升在上述加速器结构上流式应用程序执行性能,提出了两个优化程序粗粒度任务级并行性的方法:基于分离计算模式和访存模式的粗粒度并行优化;基于分层程序优化的应用程序计算流改写。   3.对冷冻电镜三维重构和高通量基因序列比对两个典型流式应用程序的加速。   4.研究了粗粒度计算模块自动生成技术,其中面向FPGA的质数基实数二维FFT计算单元生成方法具有创新性。   5.在并行基因序列比对加速器设计实现中,新的Hash索引和压缩算法,以及带有广播通道的脉动阵列结构具有创新性。
其他文献
三维增强绘制是一种关注于信息表达的绘制方式,强调对物体表面特征的增强,例如物体的表面细节、明暗对比度、高光等,突出真实场景的某些显著信息,从而生成更清晰、更易于理解的绘
利用串联质谱进行肽段和蛋白质鉴定已经成为蛋白质组学的核心技术。目前,基于串联质谱技术的蛋白质鉴定主要有两条技术路线:数据库搜索(Database Searching)和肽段从头测序(D
地理图片共享已逐渐成人们网络社交活动中的重要组成部分,既包含图片拍摄时的地理信息,又蕴含着人们的喜好、意图和形为模式,同时大量地理图片数据揭示着人们活动的共同规律
上世纪90年代,在生产流程的潜力已经挖掘到极限的情况下,各国的企业家,专家和学者们开始集中在业务流程的优化,并从很多角度,进行了大量的研究,尤其是美国,对业务流程的投资
现场可编程门阵列FPGA是一种包含可编程元件的半导体器件,可供用户现场编程,具有设计开发周期短、设计制造成本低、可反复编程、灵活性高等优点。目前,FPGA已广泛应用于空间
EAST数据系统是EAST聚交实验的重要组成部分之一,它主要用来采集、存储、分析、发布和可视化EAST实验数据,为物理研究人员分析和处理EAST实验数据提供平台。而EAST数据采集控制
三维几何建模是计算机图形学中的关键技术,是进行后期渲染、动画制作等步骤的必经环节,具有重要的研究和应用价值。点云数据作为真实世界中物体的三维几何形状的最重要的离散
三维变分资料同化系统3DVAR作为现在主流数值天气预报的同化方法,能明显改善预报数据的同化质量,随着科学研究的逐渐深入以及科学探测仪器和计算机的技术的不断发展,传统串行三
随着J2EE的发展,服务器领域的Java应用越来越多,典型的有hadoop、tomcat、weblogic和websphere,其中绝大多数是基于SunJDK6开发的。近年来国产CPU发展迅猛,其中具有代表性的
人体动作识别的关键问题是如何从底层数据中有效地挖掘高层语义信息,使计算机能够理解人类行为并更好地为人类服务。人体动作识别的研究融合了计算机视觉、图像处理、模式识