论文部分内容阅读
可重构处理器是通用处理器与专用处理器的折中,同时具有通用处理器的灵活性与专用处理器的高能效。相比于细粒度可重构处理器FPGA,粗粒度动态可重构处理器(Coarse-grained Reconfigurable Architecture,CGRA)在芯片功耗、配置文件尺寸和配置时间开销上具有先天优势,成为研究热点。粗粒度动态可重构技术远未成熟,市场上还没有大规模应用的相关产品,但其适中的灵活性、高能效性能够弥补通用处理器和专用处理器的缺陷,前景广阔。然而,粗粒度可重构体系结构在提高灵活性、降低功耗的同时,加剧了并行编程难度。并且,现有的粗粒度可重构处理器只适用于特定领域的应用。在此基础上,本课题的研究拟解决的关键技术问题为通用领域算法在粗粒度可重构体系结构上的高效映射。本文的主要工作分为三个部分。第一,以伯克利大学提出的应用类型全覆盖的13类Dwarfs为指导,精选出一套覆盖13类Dwarfs的kernel级别的benchmark,从而能够在目标可重构平台进行实现,并可以与CPU平台进行性能比较。第二,通过对可重构体系结构以及处理器编程模型的分析,提出了算法映射的系列优化措施,包括流水化映射、多层嵌套循环的映射等,并将测试程序集的13个算法以最优化方法在可重构处理器平台实现。第三,为了体现映射结果的合理性、有效性,将测试程序集在英特尔Atom平台运行并收集性能数据,与可重构平台的映射结果进行性能比较,结果显示,在当前可重构处理器的模拟环境下,性能对于Atom具有显著优势。综上所述,本文面向粗粒度动态可重构体系结构,针对通用领域算法在可重构处理器上的高效映射问题提出了有效的优化方法,并在粗粒度动态可重构平台进行了验证,对于可重构体系结构和可重构处理器编译器的设计具有一定的理论意义和应用价值。