单指令多数据流相关论文
石油是现代工业和现代文明的物质基础,是国民经济无法替代的重要能源和工业原料。地球物理勘探中的地震勘探采集技术能够完美地契......
在数字信号处理器(Digital Signal Processor,DSP)中,定点数据之间的运算是最常用的基本操作.本文设计了一款基于SIMD(Single Inst......
首先,本文介绍了SIMD扩展技术,并分析了使用SIMD扩展的三种方式,认为通过调用特定目标平台优化的第三方库是应用领域软件开发者快......
H.264解码器在申威平台移植后遇到解码效率低,视频播放不流畅等问题。为提升视频解码性能,满足国产申威平台用户的多媒体需求,首先......
处理器设计离不开软硬件的协同合作。龙芯处理器经过不断的发展,目前的处理器已经具有先进的结构设计。但是随着多媒体应用的逐步扩......
主流通用微处理器都已支持SIMD体系结构,面向SIMD的自动向量化是提高程序性能的重要手段。而在程序中手工加入指导命令,辅助编译器......
新研发的处理器越来越多地加入SIMD向量指令集,增强其数据并行处理能力。无锡江南计算所研发的国产处理器神威也搭载了SIMD向量处......
BWDSP是一款采用分簇体系结构、支持SIMD的16发射的VLIW浮点运算数字信号处理器。由于其具有强大的并行处理能力,能够较好得满足实......
BWDSP是一款高性能数字信号处理器,采用超长指令字(Vety LongInstruction Word, VILW)和单指令多数据流(Single Instruction Multi......
人脸识别技术是计算机视觉研究的重要课题,在生物认证领域有着广泛的应用前景。然而人脸图像的易获取性使其被滥用,造成隐私的泄露......
SIMD(Single Instruction Multiply Data,单指令多数据流)在多媒体技术中得到广泛应用,也非常适合作数据密集型的科学运算.SIMD的......
本文首先介绍了X射线成像系统在工业无损检测中的应用,分析了影响计算机X射线成像质量的因素,进行了X射线数字图像的降质分析。然后,......
当今的主流DSP在数据级和指令级上都实现了不同的并行技术,而且不断有新的并行技术会被运用到新的DSP内核中.从技术和效率方面看,......
VLIwDSP通过软件流水获得时间并行性,通过指令分簇获得空间并行性.指令的分簇本质上是资源分配问题.传统的指令分簇假设一条指令分到......
阐述了AVS标准的进展情况及AVS标准的特点,重点介绍了AVS熵解码的原理和采用Equator公司MAP-CABSP-15处理器中的协处理器(Vlx)实现......
GPU(Graphic Processing Unit)图形处理芯片是显卡的心脏,类似于计算机的中央处理器。在现代计算机中,特别是在家用系统和游戏中,......
<正>一、引言 并行处理是提高计算机性能的有效途径,已成为计算机系统结构研究的热点。IMD(单指令多数据流)计算机由M.J.Flynn,......
视频数字信号处理芯片XY-VDSP是采用阵列结构的SIMD处理机.XY-VDSP在硬件结构和指令级上采用高度并行,使其可以高效处理视频应用.......
随着SIMD(Single Instruction Multiple Data stream)结构DSP(Digital Signal Processor)片上集成了越来越多的处理单元,并行访存......
Intel与AMD在32位处理器市场的争夺已经日趋白热化,这点无论是在高端市场或是低端市场都已经表现得淋漓尽致。然而,为了占据新的制......
新的视频编码标准H.264使用了帧内预测的编码方式,这与以往的视频编码标准相比在很大程度上提高了帧内编码效率,节省了码流,但同时......
介绍了视频标准H.264中的4×4整数变换原理及一种一维整数变换的快速算法,在此基础上利用Kronecker乘积推导出一种适合于TMS320......
本文首先介绍了DSP采用并行结构的机理,然后针对DSP中的某些具体的并行结构,介绍一些标准算法在这些并行结构中的实现技术。......
CISC→RISC设计思想对DSP体系结构设计中数据和指令级并行性开发产生了深刻影响,融合RISC和SIMD技术的单核处理器已经成为DSP体系......
提出一种新颖的部分冗余向量基-8布斯编码乘加器,快速地处理了部分积中的正负三倍被乘数项,并以亚字并行的方式支持单指令多数据流......
排序是计算机科学中最基本的问题之一,随着众核处理器结构的不断发展,设计众核结构上的高效排序算法具有重要意义.众核处理器的一个......
如今单指令多数据流(SIMD)技术在数字信号处理器(DSP)上得到了广泛的应用,现有的向量化编译器大多都实现了自动向量化的功能,但是......
为了提高视频处理中哈夫曼解码的性能,从减少比特操作、提高处理器内存利用率的角度出发,设计了2种不同的数据结构进行哈夫曼码表的......
图像融合是图像拼接中的一个重要步骤, 用于生成无缝的融合图像. 针对当前高分辨率图像融合算法速度较慢的问题, 提出一种基于多频......
在运用行列式Schur余子式算法的理论基础上,提出了对SIMD结构的并行机,可适用于对行列式按行分块并行处理算法,把一个,z阶行列式的求值......
循环倾斜是程序优化中一种循环变换的手段,它改变空间迭代形式,将循环存在的跨迭代的并行用传统的并行标识出来,使得循环可以并行......
华睿1号是我国自主研制的一款4核微处理器,该处理器内部集成了矢量处理部件,扩展了包含快速傅里叶变换(FFT)蝶形运算指令在内的矢......
相比H.264/AVC视频编码标准,H.265/HEVC提供了更为灵活、可靠和稳定的编解码方案,极大地提高了视频的压缩效率,但对应的解码流程也......
宽单指令多数据流(Single Instruction Multiple Data,SIMD)架构数字信号处理器一般都能高效支持地址连续或等距跨步等规则应用的......
ADSP21161是美国AD公司生产的一种新的高性能、低价位的32位浮点数字信号处理器.介绍了ADSP21161的硬件结构,详细分析了ADSP21161......
介绍软件SIMD技术,在不支持SIMD架构的处理器上使用该技术实现寄存器高低字节的并行运算,提高处理器的速度。软件SIMD包括基本的加......
编译器由于程序分析能力不足,无法自动实现循环向量化或者会造成盲目自动向量化。为此,提出一种基于编译指示的向量化方法。通过在......
在云计算环境下密文top-k检索的众多方法中,该文聚焦于同态加密方法,该公钥加密方法具有不解密就能对密文进行操作的优点。在密文top......
文本信息数量的快速增长给传统的信息检索技术带来了新的挑战.搜索引擎通常使用倒排索引来高效地处理查询.为了减少存储开销和加快......
对处理器来说指令集是赋予硬件活力的催化剂,就像灵魂之于肉体。因此.AMD与Intel在指令集研发的斗争上从来没有停息过,只是随着AMD的......
AVS是我国具备自主知识产权的第2代信源编码标准。为了能够利用其它国际信源编码标准的多媒体资源,需要将其转码以符合AVS标准。通......
针对3GPP-LTE协议中多输入多输出(MIMO)均衡算法的高复杂度和高吞吐率问题,提出了一种面向软件无线电的并行MIMO均衡处理器,该处理......
随着移动平台的飞速发展,移动智能设备用户对视频的消费需求越来越大。硬件解码的方式虽然在性能方面可以满足流畅播放的要求;但是受......
嵌入式CPU作为SoC设计中最重要最关键的IP,其研发受到了广泛关注。本文主要围绕CKCORE国产32位嵌入式CPU的研制,对其体系结构、核......
随着移动互联网的飞速发展,智能终端设备用户对视频的消费需求越来越大。虽然硬件解码的方式能够满足视频流畅播放的需求,但受限于编......