一种面向四核DSP的高性能并行二维FFT算法设计与实现

来源 :第十二届计算机工程与工艺全国学术年会(NCCET'08) | 被引量 : 0次 | 上传用户:hexiaole632
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对自主研发的多核DSP体系结构特点,提出一种面向四核DSP的高性能并行二维快速傅立叶变换算法,使用软件流水和指令并行优化QLink和SDP的数据传输和控制,充分挖掘程序之间和程序内部的并行性,提高了程序的性能.RTL级实验测试结果表明该算法充分发挥多核DSP体系结构优势,取得很高的加速比.
其他文献
为了提高整个系统的效率和可靠性,VxWorks在5.5以后的版本增加了CBIO接口组件.本文简要介绍了Vxworks中CBIO磁盘高速缓存的主要原理和技术,对CBIO磁盘高速缓存主要技术的实现
为提高车辆定位精度,组合导航系统应运而生.如何有效利用多个传感器的定位数据是组合导航中研究的重点.多传感器数据融合技术是近年来发展起来的一种数据处理新技术,对数据融
会议
在VxWorks开发环境中,多核片上调试子系统(on-chip debugging subsystem)发挥着极其关键的作用。本文从开发实际出发,对VxWorks开发环境中的片上多核调试子系统的功能设计进
本文通过对GIS和GPRS的介绍,结合某行业的业务特点,通过对移动终端PDA的功能分析和GPRS接入方式的探讨,提出了基于GIS的桌行业指挥定位系统整体设计框架.同时基于服务器端应
会议
论述了嵌入式系统开发过程中有关的几个重要选择、设计工作中面临的权衡以及设计人员在专业知识上的扩充完善等问题。
导航计算系统是导航系统的核心组成部分,承担着导航系统中数据的采集、处理、传输以及反馈控制的繁重任务.该系统性能的优劣在很大程度上决定了整个导航系统的性能的好坏,因
DX是国防科大自主研制的一款高性能DSP.本文以DX芯片为研究对象,研究了降低Cache失效延迟的优化策略,设计实现了一种针对高频高性能DSP的一级数据Cache优化策略——失效流水.
会议
针对自主研发的多核DSP体系结构特点,利用共享数据池实现核间快速的数据交换,分别设计了双核和四核DSP的一维FFT并行算法,对关键的程序部分使用软件流水和手工汇编的方法进行
在DSP处理器中设计独立的地址产生器可实现算术运算与地址运算并行处理,从而提高DSP处理器的性能.本文提出了X-DSP地址产生单元的生成算法,并对其进行了硬件实现,详细讨论了
会议
X-DSP是一款面向实时嵌入式的低功耗定点数字信号处理器,本文分析了实时DSP中断控制和中断服务系统的特点,设计实现了多个优先级硬件中断的响应机制的硬件结构,在此基础上实
会议