指令级并行相关论文
SMT(同时多线程)是一种能有效提高处理器性能的技术,本丈在我们自主设计的32位高性能嵌入式数字信号处理器YHFT-D4的基础上,设计实......
本文讨论了一种低功耗高效能的新型值预测模型,然后通过实验从性能与功耗比率的角度将其与目前值预测中采用的几种预测模型进行了......
在嵌入式应用中,高性能、低功耗的计算平台至关重要,可重构技术很有希望提供这样的系统。应用程序的特性最终决定了如何使用可重构技......
对于有分支循环的软件流水,用带硬件支持的数据相关松弛方法可以在控制代码膨胀的同时,得到自适应的启动间距.数据相关松弛法生成......
为一块芯片(SoC ) 上的一个数组处理器(AP ) 的一个指令水平并行计算范例和统一体系结构在这份报纸被介绍。在这里, APU SoC 为为统......
从应用程序中开发利用尽量多的指令级并行度(Instruction Level Parallelism,简称ILP)是现代高性能超标量处理器不断追求更高性能......
该论文首先讨论了在目前的RISC微处理器上所使用的代码优化编译器的基本结构,并分析了这些代码优化编译器的缺陷以及产生这种缺陷......
该文深入研究了多重循环软件流水,以及当嵌套层数为1时的最差相关限制问题,提出了一种多重循环并行化算法:交替移位旋转(ISR:Inter......
超长指令字(VeryLongInstructionWord,VLIW)体系结构由于其较高的指令级并行度以及相对简单的硬件译码和控制逻辑,成为继CISC(Comp......
该文的主要工作是针对超长指令字体系结构的编译技术,尤其是与机器体系结构相关的优化技术进行研究.设计并基本实现了一套基于VLIW......
条件执行在降低转移指令影响提高处理器性能方面是一种比较有效的方法.它不但可以降低指令控制流变换的不可预测性、达到平缓流水......
学位
超标量流水线,超流水线和超长指令等微处理器主要是依赖指令级并行提高性能,但是指令级并行受到了指令相关的影响,造成很大空闲周期。......
随着信息技术的发展,人们需要解决的问题越来越复杂,传统的串行程序设计方法已经无法满足许多应用领域的需要,于是并行计算机和并......
BWDSP是一款采用分簇体系结构、支持SIMD的16发射的VLIW浮点运算数字信号处理器。由于其具有强大的并行处理能力,能够较好得满足实......
对于指令级并行处理器(ILP,instruction level parallelism),在执行不同应用程式时,硬件资源的需求量差异很大,甚至在同一支程式中......
临近年末,全球的PC市场依然不见有多大起色,而中国市场却吸引了业界众多的目光——技术论坛,战略合作,新品发布……这一系列的市场......
主要芯片制造商(如nVIDIA)最近的一些举动较之前更确切无疑地表明,微处理器及大型高性能计算(HPC)系统未来的设计从本质上说都将是......
本文首先提出一个能够支持多分支循环程序最优执行的VLIW体系结构模型,然后在这个模型的基础上设计了一个新的主要用于数字信号处理及图......
最近几年,微处理器设计技术迅速发展,高性能微处理器已经成为当代各类计算机系统的主要支柱。本文首先简要回顾微处理器的发展过程,然......
本文基于多线索机制,通过优化编译与硬件流水线相结合提出了一种无断流流水机制,并设计了无断流流水线( M T N B- P I P E L I N E) .该流水线主要......
设计人员考虑在SoC中使用t嵌入式DSP时至少有三种选择。第一种选择是用通用的固定DSP。第2是选择一种面向应用的DSP,较大型的DSP供......
在前不久召开的2002年的 Intel 开发者论坛上,Intel 终于正式宣布将在 Pentium 4 3.06G(下文 Pentium4简称 P4)及更高频率的 P4上......
介绍了由DSP芯片构成的多处理器并行系统的结构和性能以及在多处理器并行系统上并行实现ATR算法需要考虑的主要问题,着重研究了在......
因体系结构的特殊性,流处理器中多重循环的优化有其独特性且至关重要.本文在分析循环展开的限制因素的基础上,描述了一种基于该体......
本文介绍了片上多线程处理器的体系结构,包括商用的处理器,以及片上多线程处理器的关键技术。片上多线程处理器结合片上多处理器和......
值预测(VP,ValuePrediction)和指令重用(IR,InstructionReuse)是两种通过开发程序执行结果冗余解决数据相关的新技术.本文首先从分......
随着指令级并行的发展,多发射处理器对数据cache的端口数目提出了更高的要求,cache的功耗问题日渐突出.分析了多发射处理器中......
本文提出了一个基于存储层次和指令级并行的新并行计算模型DRAM(h,k),并在日立SR2201并行机上对该模型下并行下三角方程求解的四种......
指令级并行是保证处理器性能不断改进的重要途径。推测式执行和多控制指令并行是充分挖掘出程序中潜在并行性的关键。根据上述认识......
该文在国内首次对嵌入式系统设计方法进行系统的研究;研究过程中首次采用线程集成的概念,并且对线程集成的原理、实现方法以及相关......
随着现代半导体工业的发展,芯片的集成度不断提高,处理器设计朝着分片式的方向发展。对处理器性能的急切需求使充分挖掘程序的指令级......
指令级并行是现代高性能处理器的重要特征.对于发挥这类处理器所具有的并行处理能力来说,编译器有至关重要的影响.文中讨论指令级......
值预测和指令重用是通过开发程序执行结果的冗余来解决数据相关的两种不同的新技术.本文首先从这两种新技术的原理出发,深入剖析了......
使DSP处理器达到高性能有多种方法.然而,传统的DSP性能几乎总是以MIPS来衡量的.传统DSP通常在每个时钟周期仅完成一次操作,因此MIP......
讨论了指令级并行运算环境中多媒体数据处理的实现方法和性能.围绕MMX技术,提出了面向数据流的并行程序开发方法,实现和测试了典型......
本文阐述了一个新的观点基于软流水,我们从一维向量到二维矩阵将软流水作为一个指令级转换。这样,软流水问题自然地就被分为两个子问......
本文基于多线索机制,通过优化译与硬件流水线相结合提出了一种无断流流水机制,并设计了无断流流水线(MTNB-PIPELINE),该流水线主要通过提前进行线索切......
提出扩展选择调度,统一处理循环和非循环代码,对它们不加区分但却分别产生软件流水和全局压缩的效果;程序并行化不需要分层简化,只要顺......
立足于处理器体系结构的研究,结合可重构设计技术以确保密码处理的灵活性是密码协处理器研究的重要方法,其中如何提升密码协处理器......
同时多线程处理器SMT(Simultaneous Multi-Threading)是用于图形、图像及数字信号处理的一种可以实现指令级并行(ILP)和线程级并行(TLP)......
抽象机通常用在软件程序编译器中。提出了一个基于硬件抽象机的处理器设计方法,使用该方法设计了一个Java微处理器,并且利用硬件抽......