面向粗粒度动态可重构处理器的通用领域算法实现与优化

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:talygs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
可重构处理器是通用处理器与专用处理器的折中,同时具有通用处理器的灵活性与专用处理器的高能效。相比于细粒度可重构处理器FPGA,粗粒度动态可重构处理器(Coarse-grained Reconfigurable Architecture,CGRA)在芯片功耗、配置文件尺寸和配置时间开销上具有先天优势,成为研究热点。粗粒度动态可重构技术远未成熟,市场上还没有大规模应用的相关产品,但其适中的灵活性、高能效性能够弥补通用处理器和专用处理器的缺陷,前景广阔。然而,粗粒度可重构体系结构在提高灵活性、降低功耗的同时,加剧了并行编程难度。并且,现有的粗粒度可重构处理器只适用于特定领域的应用。在此基础上,本课题的研究拟解决的关键技术问题为通用领域算法在粗粒度可重构体系结构上的高效映射。本文的主要工作分为三个部分。第一,以伯克利大学提出的应用类型全覆盖的13类Dwarfs为指导,精选出一套覆盖13类Dwarfs的kernel级别的benchmark,从而能够在目标可重构平台进行实现,并可以与CPU平台进行性能比较。第二,通过对可重构体系结构以及处理器编程模型的分析,提出了算法映射的系列优化措施,包括流水化映射、多层嵌套循环的映射等,并将测试程序集的13个算法以最优化方法在可重构处理器平台实现。第三,为了体现映射结果的合理性、有效性,将测试程序集在英特尔Atom平台运行并收集性能数据,与可重构平台的映射结果进行性能比较,结果显示,在当前可重构处理器的模拟环境下,性能对于Atom具有显著优势。综上所述,本文面向粗粒度动态可重构体系结构,针对通用领域算法在可重构处理器上的高效映射问题提出了有效的优化方法,并在粗粒度动态可重构平台进行了验证,对于可重构体系结构和可重构处理器编译器的设计具有一定的理论意义和应用价值。
其他文献
随着Web的快速发展和普及,人们越来越依赖于网络获取信息。但由于Web信息来源极为广泛,使其有高动态性、自主性、多样性等特征,信息发布带有很大的随意性,在它为用户提供信息
随着工作流技术的广泛应用,人们对工作流系统提出了更高的要求,特别是在信息管理应用方面,要求工作流能够更好地适应业务规则的变化,有更好的业务灵活性和敏捷性。为了达到该要求
真空热处理技术具有无氧化、无脱碳、有脱脂、除气效果好、表面质量好、变形微小、使用寿命长、无污染、无公害、自动化程度高等一系列的优点,并且真空热处理技术能够代替传
当前的数字水印技术大都是针对静止图象、视频流和音频流这些媒体数据类型的,而对三维几何模型数据的水印技术的研究工作相对较少。但是,随着越来越多的基于CAD的三维数据在
近些年来,计算机网络已经得到了飞速的发展,并且在政治、经济、军事、社会生活等各个领域发挥着日益重要的作用。但是由于种种原因,计算机网络也暴露出很多安全问题,攻击计算机网
21世纪是一个信息时代,人们在工作生活中大量接触图像,并在彼此之间互相传播,为了使图像传送更快捷便利,图像压缩技术研究变得非常迫切。1987年由美国数学家Barnsley和Sloan[
传统的分布式协同设计系统都是使用客户服务器模式设计的,通过一个功能强大的服务器为组内成员提供协作。其主要的功能是实现文件与信息的共享。但是,这种体系结构不灵活,本
随着网络技术的迅速发展,在任何时候、任何地点接入信息网获得所需信息成为21世纪人类的普遍要求,移动计算技术使这种需求得以实现。由于移动计算环境与固定计算环境的差异,
随着网络技术的不断发展,网络应用不断丰富起来,从静态文件、图片的获取发展到动态多媒体文件的获取,尤其以高清晰的视频文件的下载占有很大比例,但是用户需要花费大量时间等
随着计算机和网络的快速发展,越来越多的嵌入式设备接入了互联网,嵌入式系统网络化程度的不断提高,其安全问题显得越来越重要。提高系统的安全性和可靠性是未来嵌入式系统的