单指令流多数据流相关论文
稀疏矩阵向量乘法是数值计算的核心子程序之一。在实际应用中使用迭代法求解大规模稀疏线性方程组来逼近其精确解,Sp MV作为迭代求......
稀疏矩阵向量乘(SpMV)是科学计算中最重要的核心算法之一。理论分析和实际测试结果都表明,SpMV属于访存密集型应用。由于目前主流编......
目前HXDSP1042编译器的编程模型已经可以支持以字节为单位的寻址模式以及64位数据的存取与运算,这对于提高浮点数据运算的精度具有......
多视点视频编码技术(Multi-view Video Coding,MVC)是一种能提供更加真实的场景再现、具有立体感的新型视频技术。由于视点数目的增......
提出了一种支持多种指令的地址计算部件,它能够支持在线性寻址或循环寻址的模式下以对齐和非对齐方式访问存储器,同时支持加减......
本文阐明了并行计算的目的与意义,引入了并行计算机体系结构特别是单指令流多数据流和机群的概念。将Petri网应用于计算机并行......
本文提出了一种SIMD(单指令流多数据流)并行多核VLIW(超长指令字)处理器的时钟精确模拟器实现技术.该技术能以较小的代价对SIMD并......
伴随着音视频娱乐行业的迅速进步,数字信号处理器正逐渐成为研究人员重点关注的对象,如何提高数字信号处理器平台上相关应用的性能......
蝶形网络是并行计算中的一种重要的网络拓扑结构。并行计算模型是并行算法设计和分析的基础。文章以并行FFT算法的基本思想为基础,......
论文详细介绍了基于LS NMD计算机的并行计算的面向对象仿真,提出了一个新颖的SIMD机的面向对象软件模型,并在PC机Windows平台上用Mic......
介绍了高性能定点可重构DSP处理器的数据通路设计.该数据通路以功能强大的16位定点计算单元为基础,搭建起高速16位数据处理平台;并......
针对BWDSP100体系结构特点,基于循环展开、指令调度以及软件流水等并行优化技术,结合多簇超长指令架构的特点,通过使用超算硬件指......
针对面向SDR应用的SIMD数字信号处理器高带宽数据访存需求,提出并实现了一种新型的向量存储结构。该向量存储器由16路向量存储块构......
嵌入式应用中,单指令流多数据流(SIMD,single instruction multiple data)结构的向量处理器在蓬勃发展的同时,也面临着如何高效利用其丰......
二维DCT变换是视频编码协议H.264和MPEG系列标准的主要运算之一.传统的处理器中的运算无法满足视频编/解码的实时性要求.针对二维D......
基于MIPS32 4k系列的处理器架构,提出一种AES算法的SIMD指令集扩展方法,利用处理器流水线对齐级和AES数据访问单元,实现64 bit数据......
摘要:PAML是一款利用最大似然法进行系统发育分析的软件包,被广泛使用。然而,由于模型复杂、参数众多,PAMI。的计算过程非常耗时。对PA......
为提高龙芯平台的多媒体处理能力,分析龙芯处理器核GS464/GS464E的LoongSIMD指令系统,提出SIMD指令级优化方法。通过分析FFmpeg的......
尽管在过去的20年中,半导体工艺的发展和体系结构技术的推动,使得微处理器的性能提升了有上千倍之多。然而来自应用的性能需求却依然......
本文描述了一种基于可重构流水线阵列的系统—(RPAS-Reconfigurable Pipelined Array System),该阵列系统适用于大计算量的数字信......
针对数字信号处理的应用特点,提出了一种识别SIMD指令的一般性方法;针对分簇结构SIMD指令的特点,给出了新的指令分簇算法和寄存器......