面向多媒体的粗粒度可重构处理单元的结构研究

来源 :西北工业大学 | 被引量 : 0次 | 上传用户:qhjxiaofeitian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体数字信号处理应用领域的迅速发展,对计算机处理能力的要求越来越高。可重构处理系统将微处理器的灵活性和ASICs的高效性结合起来,通过配置可重构处理单元以满足不同应用的计算要求。此外,多媒体应用领域更多的是基于以字为单位的数据类型的定点运算,这些计算密集型的任务更适合于粗粒度的体系结构。 因此,本文面向多媒体应用领域的三种基本计算结构:FIR(Finite Impulse Response)、FFT(Fast Fourier Transform)、点积类运算,实现了一种粗粒度的、高效、灵活的片上可重构处理单元——龙腾-DSRU(Domain Specific Reconfigurable Unit)。论文的主要研究工作包括: ● 以多媒体处理中具有高计算量,高并行性的应用为研究对象,提出了可重构阵列处理单元模型龙腾-DSRU。龙腾-DSRU模型设计的特点是粗粒度、Crossbar互连、VLIW计算模型、多配置文件。 ● 研究多媒体领域常用算法的硬件实现,主要是FIR、FFT、DCT等算法,设计并实现了一个高速、高效的可重构ALU,使其能够恰当的与上述算法中的密集型计算相匹配,在最大程度上发挥其灵活性与高效性。 ● 研究并设计了可配置的Crossbar和局部存储器,可以灵活的进行数据的缓存并对各部件进行互连。 ● 为了减少控制信息,采用两级配置逻辑,第一级使用配置寄存器堆对龙腾-DSRU的数据路径进行灵活配置,第二级使用译码器RAM对配置寄存器堆进行灵活配置,将984个控制信号减少到了6个。 ● 研究FIR、FFT、点积等算法在龙腾-DSRU上的映射,其中FFT算法在龙腾-DSRU上的映射完全避免了操作数读取按位序取反的寻址方式,最多可实现1024点复数FFT运算。 ● 在FPGA上验证了龙腾-DSRU原型,并在SMIC 0.18um工艺下进行逻辑综合。40MHz工作频率下,1024点复数FFT可以在64.5μs内完成,通过性能分析,龙腾-DSRU完全满足多媒体处理领域的应用要求。
其他文献
轴承是旋转机械设备中应用最为广泛的一种通用部件,其工作运行状态直接影响到整台机器的性能。论文在结合理论和实践的基础上,对基于隐马尔可夫模型(Hidden Markov Model,HMM)的
随着通信技术、嵌入式计算技术和传感器技术的飞速发展和日益成熟,无线传感器网络作为普适计算的一种新的应用模式成为了近年来学术界的研究热点之一。无线传感器网络的随机部
全景图的自动生成技术是近年来兴起的基于图像的绘制技术中的重要研究内容,其涉及到计算机图形学、图像处理及计算几何等诸多学科。本文深入研究了全景图生成的三个步骤:图像采
英语是世界公用语言,英汉机器翻译的研究也有近50年的历史,但是译文质量仍未达到忠实通顺的要求。目前英汉机器翻译技术遭遇瓶颈,其研究攻关势在必行。 本文立足于自然语
人工免疫是当前计算智能领域的新兴研究热点。本课题以人工免疫系统为研究对象,探索具有可扩展性、具有一定通用性的人工免疫系统模型,采用人工免疫原理设计垃圾邮件过滤器模
XML 数字签名集安全性与灵活性于一体,实现了传统数字签名所不能实现的签名粒度,不仅可以保证信息的完整性,真实性和不可否认性,还可以提高数据的扩展性和互操作性。排列码加密算
三维视景仿真技术是虚拟现实技术的一个重要发展方向,它采用以计算机技术为核心的现代高科技生成逼真的视、听、触觉一体化的特定范围的虚拟环境,用户借助必要的设备以自然的方
数字水印技术作为一种信息隐藏手段,其基本思想是在图像、音频和视频等数字产品中嵌入秘密信息,以便保护数字产品的版权。目前,数字水印技术已经逐步发展,并广泛地应用于图像
本文在综合分析XML安全现有成果的基础上,将具有我们自主知识产权的排列码加密算法应用到XML安全领域。本文详细介绍了排列码加密算法原理,用Java语言实现了分组长度为8比特
隐蔽通道指操作系统和网络环境中客观存在的,且本意不是被设计用于传输信息的通信信道。隐蔽通道可被恶意攻击者利用,实现隐蔽的数据传输,危害系统安全。在智能手机操作系统A