论文部分内容阅读
随着多媒体数字信号处理应用领域的迅速发展,对计算机处理能力的要求越来越高。可重构处理系统将微处理器的灵活性和ASICs的高效性结合起来,通过配置可重构处理单元以满足不同应用的计算要求。此外,多媒体应用领域更多的是基于以字为单位的数据类型的定点运算,这些计算密集型的任务更适合于粗粒度的体系结构。 因此,本文面向多媒体应用领域的三种基本计算结构:FIR(Finite Impulse Response)、FFT(Fast Fourier Transform)、点积类运算,实现了一种粗粒度的、高效、灵活的片上可重构处理单元——龙腾-DSRU(Domain Specific Reconfigurable Unit)。论文的主要研究工作包括: ● 以多媒体处理中具有高计算量,高并行性的应用为研究对象,提出了可重构阵列处理单元模型龙腾-DSRU。龙腾-DSRU模型设计的特点是粗粒度、Crossbar互连、VLIW计算模型、多配置文件。 ● 研究多媒体领域常用算法的硬件实现,主要是FIR、FFT、DCT等算法,设计并实现了一个高速、高效的可重构ALU,使其能够恰当的与上述算法中的密集型计算相匹配,在最大程度上发挥其灵活性与高效性。 ● 研究并设计了可配置的Crossbar和局部存储器,可以灵活的进行数据的缓存并对各部件进行互连。 ● 为了减少控制信息,采用两级配置逻辑,第一级使用配置寄存器堆对龙腾-DSRU的数据路径进行灵活配置,第二级使用译码器RAM对配置寄存器堆进行灵活配置,将984个控制信号减少到了6个。 ● 研究FIR、FFT、点积等算法在龙腾-DSRU上的映射,其中FFT算法在龙腾-DSRU上的映射完全避免了操作数读取按位序取反的寻址方式,最多可实现1024点复数FFT运算。 ● 在FPGA上验证了龙腾-DSRU原型,并在SMIC 0.18um工艺下进行逻辑综合。40MHz工作频率下,1024点复数FFT可以在64.5μs内完成,通过性能分析,龙腾-DSRU完全满足多媒体处理领域的应用要求。