基于FPGA的并行加速实验平台原型设计与实现

来源 :山东大学 | 被引量 : 0次 | 上传用户:king_casper
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着物联网等新概念的提出和计算机技术的进步,嵌入式系统正以前所未有的速度发展,各种新型的嵌入式设备不断涌现;而且这些新出现的设备对智能化和实时性的要求越来越高,因此需要的运算量也越来越大。但是,传统的嵌入式处理器由于受性能、频率等方面的限制,单个的处理器已经在很大程度上没法满足需求。如果采用多个嵌入式处理器来提高处理速度,其功耗必将会大大增加,对能量有限的嵌入式设备而言,这也是不合适的。在这种情况下,现场可编程逻辑门阵列(Field Programmable Gate Array, FPGA)加嵌入式处理器的异构体系架构成为了解决上述问题的一个理想方案之一。目前基于FPGA的并行加速模型可谓多种多样,针对具体的算法采用FPGA作为协处理器进行并行加速研究也是学术界的热点之一。但是通常,将算法采用FPGA进行并行加速后,多采用仿真和分析得到加速效果,缺少实际的板级测试,这主要是因为算法测试中需要与主控制器之间进行大量而且快速的数据交换,但是目前尚缺少这样的数据交换平台,因此急需这样一个可以进行高速数据交换的并行加速实验平台,用于加速效果的板级测试。本文设计了一个并行加速实验平台原型。为达到数据交换速度要求,该平台采用PCI Express总线与主控制器进行数据交换,为加速数据传输,采用了DMA传输的方式。文中给出了实验平台的总体设计及实现步骤和方法。采用自上而下的模块化设计模式,将平台分为了PCI Express端点控制器模块、PCI Express事物层报文处理及DMA控制模块、存储控制器模块、并行加速实验模块和并行加速模块与存储器控制器之间的接口模块。作为整个平台的核心模块,PCI Express事务层报文处理及DMA控制器模块逻辑复杂,子模块众多,本文中重点介绍了该模块的详细设计和实现过程,将其划分为发送部件、接收部件、DMA控制器、读请求封装器、发送数据仲裁及准备模块、接收数据分发模块、DMA与存储器控制器接口模块和DMA与并行加速模块接口等子模块分别实现。同时也给出了其他模块的设计实现过程。然后以排序算法为例,介绍了并行排序加速器的实现,以此为基础,设计实现了并行加速模块,从而完成了整个实验平台的设计实现。本文最后对上述设计实现的平台进行了测试,给出了平台的实际资源占用、最大交换速度及实际加速效果等数据。通过实验证明,该平台满足并行加速实验的要求,可以进行算法并行加速的板级测试和实验。
其他文献
近年来,随着云计算技术快速地发展,互联网业务数目与规模得到了空前的增长,传统的互联网结构面临这随之而来的一系列问题,其中网络僵化问题尤为突出。如果采用以往的单纯增加
随着高新技术的飞速发展,固态盘被引入到存储系统中,它的高性能、低能耗等特点能够满足现代数据存储的需要,对解决传统磁盘的性能瓶颈起到了很好的作用。但是固态盘的价格高,容量
Nand Flash是目前消费性电子产品中被广泛使用的元件之一。由于Nand Flash的物理机构特点,容易发生错误,如何保证数据的可靠性,成为一项重要的研究课题。采用纠错码(Error Corre
作为生物认证技术领域的重要一员,基于手掌的身份认证系统正以其安全、准确、快捷的特点而受到越来越广泛的重视,具有广阔的应用前景。本文针对掌纹认证系统若干关键技术进行了
评论文本的观点挖掘是指通过对评论文本中的观点、立场等主观信息进行挖掘与分析,判断评论文本中观点的情感倾向性。随着评论文本在人们生活中的广泛应用,仅仅挖掘评论文本的
随着移动终端设备的发展,一种新兴的医疗保健模式移动医疗迅速发展。未来,移动医疗发展潜力巨大。本课题设计实现了面向云平台的心电交互系统。系统包括数据采集端,心电监测
近年来随着移动互联网的兴起,市场上出现了越来越多的嵌入式解决方案,包括手机解决方案、IPTV解决方案、安防监控解决方案等等。不同厂家都推出带有自身特色的解决方案,配套各自
数据挖掘是当今计算机科学中快速发展的一个研究方向,它涉及到多个领域的知识。数据挖掘能从大量的数据中发现一些人们事先未知的、潜在的、有趣的知识,因此广泛被应用于商业分
抠图是一种精确提取任意图像或视频中前景物体的图像处理技术。该技术最早可以追溯到19世纪50年代的光学抠图,现在随着计算机工业的迅猛发展,数字抠图取代了传统的光学抠图并
多智能体系统的分布式协同控制有着十分广泛的工程应用前景,在工业和军事领域中,广泛存在着多智能体系统的协同控制,比如无人驾驶飞行器、无人驾驶车辆的合作控制、无人车的