自动向量化相关论文
随着单指令流多数据流(SIMD)技术的迅速发展,近年来许多面向SIMD扩展部件的自动向量化编译方法被提出,有效缓解了程序员手写向量程......
通过自动向量化编译技术自动生成向量程序,以有效地利用微处理器底层SIMD硬件提升程序的执行性能,已成为编译器研究的一个重要方向......
编译系统作为高级程序语言到机器码的转换器,它是联系几乎所有软件与硬件的桥梁,编译系统所生成代码的执行效率直接影响硬件体系结......
通过编译优化分析发现,GCC编译器所采用的无效代码删除和自动向量化优化策略较为保守。当函数调用层数太多、复杂度太高时,无效代......
由于多媒体程序在现代计算机系统中越来越广泛的应用,其性能受到了普遍重视。目前,大多数通用微处理器都通过引入一套短SIMD指令对媒......
处理器设计离不开软硬件的协同合作。龙芯处理器经过不断的发展,目前的处理器已经具有先进的结构设计。但是随着多媒体应用的逐步扩......
随着多媒体产业的迅猛发展,许多通用微处理器中都加入了SIMD扩展指令集。处理器系统需要硬件设备、操作系统和编译器的紧密耦合才能......
动芯是由中科院计算所无线通信技术研究中心自主研发的面向宽带无线通信的基带信号处理芯片,矢量DSP(Digital signal processor)是......
当前,主流通用微处理器都已经实现了多核并行以及处理器核内的SIMD并行。多线程并行且每个线程尽可能地利用SIMD并行是充分开发此......
主流通用微处理器都已支持SIMD体系结构,面向SIMD的自动向量化是提高程序性能的重要手段。而在程序中手工加入指导命令,辅助编译器......
为满足无线通信对实时性、低功耗的要求,信号处理器多采用SIMD(single instruction multiple data,单指令多数据)架构以加速对程序......
本文对向量VLIW DSP的寄存器偶对相关的代码优化技术进行了研究,具体包括寄存器偶对操作数处理、寄存器偶对指派、自动向量化过程......
当前含有SIMD功能部件的计算机体系结构中,其向量部件与标量部件一般可并行工作。为了提高系统的硬件资源利用率,论文针对向量化......
数据的快速及时供应对访存密集型程序的性能有着直接的影响.提出一种多倍数据供应MDS(Multiple Data Supply)的编译优化方法,在不......
根据龙芯3B处理器特有的SIMD运算部件和指令集,在GCC编译器中实现了SIMD访存和SIMD运算的自动向量化.针对SIMD访存,给出了现有的访......
作为多媒体和科学计算等领域重要的程序加速器件之一,SIMD扩展部件现已广泛集成于各类处理器中。自动向量化方法是目前生成SIMD向......
循环分布是开发向量化程序的一个有效的方法。但是由于程序中的数据相关性,当前的自动向量化编译器实现完全的循环分布非常困难。......
基于编译指导的自动向量化已经成为编译器开发SIMD体系结构性能潜力的必然选择。OpenMP 4.0规范新增了SIMD编译指导语句,在开发中......
自动向量化技术是一种针对单指令多数据(SIMD)向量化计算单元的并行编译优化技术,它能够自动将源程序中多个相同标量操作合并为一......
为了使循环在编译过程中更充分地被向量化,提出了一种基于代价分析的向量化循环分割技术。标记出了迭代依赖间隔中不存在依赖关系的......
如今单指令多数据流(SIMD)技术在数字信号处理器(DSP)上得到了广泛的应用,现有的向量化编译器大多都实现了自动向量化的功能,但是......
SIMD数据并行结构在高性能通用微处理器中普遍存在,编译器的自动向量化是充分开发SIMD并行的主要手段之一.GCC编译器作为广泛使用......
编译器由于程序分析能力不足,无法自动实现循环向量化或者会造成盲目自动向量化。为此,提出一种基于编译指示的向量化方法。通过在......
由于SLP自动向量化算法使用的启发式策略会丢失一定的向量化机会,本文提出一种基于动态规划的自动向量化方法DPSLP,该方法采用比SL......
SIMD(single instruction multiple data)体系结构在高性能计算与嵌入式多媒体计算中扮演着重要的角色,对于SIMD指令的自动向量化......
超长指令字(VLIW)体系结构已经为高端数字信号处理器(DSP)所普遍采用。VLIW体系结构主要采用静态指令调度技术,因此其硬件行为很大......
主流通用处理器都已经实现了多核并行以及处理器核内的SIMD并行.虽然GCC编译器实现了面向SIMD并行的自动向量化,但是编译器针对Ope......
SIMD扩展部件是一种在多媒体程序和科学计算程序中提供指令并行的加速部件。本文首先介绍SIMD扩展部件的背景及行业现状,然后从挖......
随着SIMD扩展技术的不断发展,自动向量化逐步成为程序优化的重点.然而,大部分程序本身不能直接被向量化,需要通过循环变换来发掘潜......
SIMD扩展部件是集成到通用处理器中的加速部件,旨在发掘多媒体程序和科学计算程序的数据级并行.首先介绍SIMD扩展部件的背景和研究现......
SIMD(Single-Instruction-Multiple-Data)体系结构在现代处理器体系结构中扮演重要的角色。多种国产高性能通用处理器也大都实现了SI......
多核处理器的性能与系统软件有着密切的联系:操作系统是处理器与应用程序之间的接口,对于充分利用处理器特性和提高应用程序的性能......
自动向量化技术是编译器提高程序并行性的优化方法。随着支持SIMD结构处理器的计算平台的广泛应用,自动向量化技术也成为编译器技......