单指令多数据相关论文
20世纪90年代以来,JPEG、H.263、MPEG-1、MPEG-2等图像多媒体国际标准相继出台,它们成功地应用于多种实用场合。但是,随着时代的发......
随着社会的不断信息化,多媒体通信成为人们日常信息交流的一种重要手段。由于多媒体信息尤其是视频信息数据庞大,因此对多媒体信息......
近年来多媒体应用逐渐成为计算领域研究的热点。为了获得更为卓越的性能,几乎所有的通用处理器生产厂商都为他们的处理器集成了一个......
视频编解码标准从最早的MPEG-1和H.261开始发展,到如今使用广泛的H.164/AVC,再到下一代编码视频标准HEVC(H.265),经历了多核发展过程,针......
综合孔径雷达(Synthetic Aperture Radar, SAR)技术近几年有了很快的发展,更高的分辨率以及更大的照射范围都使地面处理系统面临着......
本文以5G UDN微基站中大规模MIMO的信道估计和信道均衡为背景,设计复变量矩阵处理器。本文不包括复变量矩阵处理之外的基带处理(例......
X-CT机的发明,在医学界引起了爆炸性的轰动,被认为是继伦琴发现X射线之后,工程学科对医学的又一划时代的贡献.1989年,螺旋CT的问世......
特性rn·高达500MHz的双PowerPc G4处理器rn·内置先进的“极速引擎”矢量处理单元,包括162个集成单指令多数据(sIMD)指令......
简单介绍了多媒体MMX指令可以高效率进行矢量和矩阵运算的特点 ,以工业控制中的静态解耦控制为例 ,对MMX技术的使用作了说明 ,并实......
为了充分利用CELL BE处理器SIMD技术的数据并行处理能力,本文介绍一种运动估计算法.和已有的钻石搜索算法fDS)相比该算法能够实现......
从单指令多数据并行运算的角度出发,将面向对象的思想引入到SAD值计算的并行操作过程中,给出了一种改进的图像组织优化算法,通过对......
提出了基于单指令多数据(single instruction multipledata,SIMD)指令集架构的4×4变换系数重用算法,用于简化H.264/AVC自适应块变......
将面向对象思想引入到SAD值计算的并行操作过程中,并从SIMD并行运算的角度出发,给出了改进的图像组织优化算法,通过对MMX优化后的......
针对64位高性能计算,本文简述了如何配置64位编程环境,并对64位SIMD指令作了介绍。通过一个实例验证了利用64位SIMD指令可以较好地......
为了提高视频图像处理速度与硬件资源利用,针对一种基于精简指令集处理器与数字信号处理器(RISC/DSP)混合体系结构的媒体处理器:浙大数......
提出一种适用于通用DSP平台的H.264视频编码器软件架构.以该架构基础实现的H.264视频编码器软件可以高效地运行在DSP系统中,以满足视频......
在锥束CT图像重建算法研究中,通常利用计算机仿真方法生成理想的投影数据。针对体素模型下投影仿真速度慢的问题,提出了一种快速仿......
通过对多核处理器体系结构、多核单元内部结构设计及指令级并行运行模式等方面进行深入研究,探索适用于无线通信的多核并行处理器。......
针对DSP在应用中大量的使用不同精度的小数运算,对数据运算单元进行详细设计.通过对Q15格式小数计算特点的分析,增加多精度累加型......
针对嵌入式应用中三维图形渲染的要求,设计了一款可编程的多线程顶点处理器.该顶点处理器采用单指令多数据结构,一条指令能够同时......
简要介绍了AVS视频编码标准的主要特点以及单指令多数据(SIMD)汇编指令集运算优势,通过分析AVS参考解码器软件的性能以及造成解码器速......
针对软件无线电中存在通用数字信号处理器(DSP)计算能力不足以及专用基带处理器缺乏扩展性的问题,提出了一种新的处理器:面向软件无线......
介绍了一种应用于ARM处理器的增强DSP功能乘加单元.为了减小乘加指令的周期数,采用了两个并行16×16位乘加单元构成的单指令多......
相对于硬件接收机,GPS软件接收机具有很强的灵活性,适合对GPS的各种算法进行研究。软件接收机要达到实时性能,则必须具有较少的数......
WHIRL是Open64采用的一种通用的中间表示,支持多种高级语言和多种目标机。Open64的后端优化工作都是基于WHIRL设计的。BWDSF是一款......
简要介绍了单指令多数据(Single-IstructionMultiple-Data,SIMD)指令系统,并用该技术对H.264中的整数离散余弦变换(DiscreteCosine......
传统数据流依赖分析方法在处理共享内存单指令多数据(SPMD)程序时,不能识别共享数据访问语句所属的处理节点,也不能消除执行顺序不......
近年来,深度学习成功地应用在目标检测、图像识别、语音识别、自然语言处理等多个领域。由于需要大量的计算资源,深度学习相关算法......
针对单指令多数据(SIMD)并行多媒体扩展在图像和视频等媒体应用中数据组织和存取等非有效计算开销过大的问题,采用嵌入式处理器面......
随着二代基因测序技术的发展及其在药物研发、疾病诊断等领域的广泛应用,基因测序数据呈现指数级增长。海量的基因测序数据需要有......
H.264具有更好的编码效率,但其高复杂度无法满足实时应用。针对低码率应用,分析各编码工具的性能并选取合理编码框架,同时利用单指令多......
为了减少传统SIMD多媒体扩展体系存在的数据置换时间开销,该文提出了一种新的多媒体扩展体系。该体系在指令定义中,包含显性的数据......
低密度校验(Low Density Parity Check,LDPC)码是由Gallager提出的一类性能逼近香农限的线性分组码。近年来,随着数字视频媒体的快......
近年来,传统的SOC设计方法已无法跟上数据密集型应用的需求。采用了一种面向应用的设计思路,通过添加定制的协处理器和扩展指令集......
从单指令多数据(SIMD)并行运算的角度出发,将面向对象的思想引入到SAD值计算的并行操作中,给出了改进的图像组织优化算法,并对多个......
整数上的离散高斯取样是格密码体制实现的基本操作,也是决定安全性的重要因素,但可能受到计时攻击从而造成秘密信息的泄漏。为此,......
在建筑信息建模的精确碰撞检测应用中,数据量日趋庞大,但串行执行无法随处理机主频的增加而持续加速。针对该问题,构建面向多核及......
随着视频应用对处理器性能要求的不断提高,面向视频编解码的专用指令集处理器(Application Specific Instruction-set Processor,A......
VLIW编译器实现指令并行性挖掘、相关性检查、指令调度等职能,对VLIW处理器的性能影响较大。本文基于一款VLIW DSP芯片,利用可重定位......
SIMD单元集成已经成为提高处理器性能的重要途径之一。虽然定点SIMD单元的硬件复用低成本设计技术已经较为成熟,但是,大部分浮点SIMD......
现代3D图形处理器已从固定渲染管线发展成可编程渲染管线,且其并行度越来越高,研究并设计高性能的3D图形处理器对3D图形处理具有重......
随着多媒体应用的普及和高性能计算的需求,越来越多的处理器集成了SIMD扩展.为了针对不同SIMD扩展部件自动生成高效的向量化代码,......
随着深度学习技术的发展,深度学习算法的准确性不断提高,通过深度学习来代替机器学习算法的方式被广泛认可,卷积神经网络是深度学......
作为应用软件模型和计算机硬件之间的桥梁,编程模型在计算机领域的重要性不言而喻。但随着具备细粒度并行计算能力的图形处理器(GP......
针对目前雷达对其数据和信号处理能力需求的不断攀升,传统的雷达数字处理系统己远远满足不了实时高速大吞吐量的处理需求,而且传统......
面向移动终端处理器的低功耗、低成本、高效率、灵活升级的需求,本文在对LTEA基带算法并行性分析的基础上,提出了一种基于超长指令......
针对部分层间并行球形译码(PIPSD)算法的特点,基于超长指令字(VLIW)和单指令多数据(SIMD)混合结构的矢量处理器原型,合理安排处理......
当前以LTE/LTE Advanced为代表的第4代移动通信技术(4G)已开始进入商用阶段,LTE-Advanced作为LTE标准的演进除了提供更高的极限吞......