循环展开相关论文
针对计算机平台在图像处理过程中面临的高能耗问题,研究了电网巡检故障图像识别的低功耗神经网络加速方法.采用直接映射方式将卷积......
当前的MD5解密算法无法适应申威架构,不能充分发挥申威26010众核处理器的性能优势.针对上述问题,采用散列初始化、循环展开、链接......
作为数字信号处理领域的专用处理器,DSP被广泛应用于各种信号处理机上,由于其应用场景多为要求效率高且实时性高的场景,当前流行的......
软件流水是开发循环程序指令级并行性的重要调度技术,其有效性受到2方面的限制:一方面软件流水的开销抵消了它的性能;另一方面,过......
过去几十年编译器的优化主要使用的是人工调优的方法。随着计算机体系结构的不断发展,编译器的优化变得更加复杂。编译器人工调优......
指令调度依据机器资源特征和程序属性,通过调整指令的执行次序来提高指令级并行度,是一种重要的编译优化技术。一般地,指令调度考虑的......
循环展开是一种非常重要的循环变换技术,不仅能够直接提高程序的性能,而且可以为其它优化创造优化机会。目前编译器基本都是使用启......
随着信息技术的发展,人们需要解决的问题越来越复杂,传统的串行程序设计方法已经无法满足许多应用领域的需要,于是并行计算机和并......
在对试验措施加以一定程度的应用的基础上,分析冻融循环问题对混凝土抗压、抗折以及劈拉强度造成的影响,站在微观具体构成结构的曾......
新一代通用微处理器Cell已开发成功(见图15),由基于IBM公司Power体系结构的64位CPU和处理128位寄存器的8个独立的信号处理器SPE组......
试论青年思想教育过程的基本特征黄松鹤青年思想教育过程,是青年思想教育学的核心内容,它是制定青年思想教育原则,探究青年思想教育的......
印度是举办国际影展相当频繁的国家,它每年举办的国际影展有10来个,而其中以印度国际摄影循环展的组别最为齐全,影响最为深远。 ......
介绍了由DSP芯片构成的多处理器并行系统的结构和性能以及在多处理器并行系统上并行实现ATR算法需要考虑的主要问题,着重研究了在......
如果要用“气势磅礴”来形容一个国际影展,那么,笔者认为非奥地利超级国际摄影循环展莫属。奥地利超级国际摄影循环展开始于1992年,短短十......
上周,沪深股市继续弱势下跌,最后一个交易日才有所反弹,但量能释放不充分。我们认为,随着国内经济增速的逐步回升,政策收紧预期将......
Matrix是一款具有VLIW和SIMD特征的自主知识产权的高性能DSP,其编译器的优化是重要且具有挑战性的工作,而编译指导是编译器优......
因体系结构的特殊性,流处理器中多重循环的优化有其独特性且至关重要.本文在分析循环展开的限制因素的基础上,描述了一种基于该体......
软件流水一种有效的用于开发循环体间指令级并行性的优化技术,循环展开是另一种用于开发循环指令级并行性的技术.研究表明,在软件......
结合循环殿开技术发展了一种适合于三维有限元分析的快速稀疏直接静力求解方法。提出基于超方程概念的列指标的稀疏索引存贮方案与......
伴随着音视频娱乐行业的迅速进步,数字信号处理器正逐渐成为研究人员重点关注的对象,如何提高数字信号处理器平台上相关应用的性能......
提出了一种在高性能RISC芯片上进行图象中低层处理的寄存器优化方法。使用该方法能使处理速度提高将近一倍,在TMS320c40上所做的实验表明应用该方......
在研究超长指令 (VL IW,Very L ong Instruction Word)体系结构的基础上 ,总结了 VL IW体系结构的指令结构特征、处理器结构体征和......
软件流水是开发指令级并行性的重要方法之一.IA-64是支持软件流水的EPIC(显式并行指令计算)体系结构.通过对NAS Benchmarks和Media......
为了解决算法程序自动映射到可重构媒体处理器的问题,有效提高程序并行执行的效率,提出一种具有自动并行化的任务编译前端.该任务......
本文对经典矩阵相乘A*B算法提出多种优化方法:根据局部性原理,提出对矩阵B进行转置;根据计算机缓存的大小与矩阵A与矩阵B的规模进......
对智能规划中的通用规划思想及方法进行了全面综述。通用规划是对特定的规划领域制定通用的解形式,从而可以不通过搜索而直接得到......
在软件流水中应用循环展开可以实现分数值的启动间距,提高资源的利用率,同时基于展开的优化技术可以降低程序的资源需求和关键路径......
谓词执行是在控制流存在的条件下可以有效挖掘指令级并行性的硬件机制,而在分簇结构上实现谓词机制,可以提高分簇结构上条件的执行......
软件流水线通过重叠连续的循环实体来实现有效的精细调度.然而,其性能可能受限制于循环里缺乏足够的并行操作或者资源需求."先展开......
塔式起重机结构有限元分析中,静力方程求解器是分析程序的核心。随着塔机求解规模的增大及对求解速度的高要求.传统的直接求解器愈显......
提出了一种在高性能RISC芯片上进行图象中低层处理的寄存器优化方法,使用该方法能够处理速度提高将近一倍,在TMS320c40上所做的实验表明应用该方法......
执行效率是衡量DSP程序的性能的重要指标,因而程序的优化就显得十分必要.在TS201的环境下,基于汇编语言,结合MTI(动目标显示)的程序对SIM......
循环展开是一项常用的循环优化技术。当前针对串行程序的循环展开技术已经比较成熟,但是在实际应用中没有针对向量程序进行有效的......
针对向量编译的不足,提出一种基于循环展开的子字并行指令自动生成的方法.该方法利用传统的循环变换技术对多媒体应用中可以进行子......
为高效实现H.264多模式帧内预测,解决其计算复杂度高造成的计算压力,本文根据H.264帧内预测算法的计算密集与数据并行的特征,基于流处理......
滑动窗口广泛应用于图像处理、模式识别和数字信号处理中,它具有数据量大、计算密集等特点.可重构硬件为滑动窗口应用提供了一个灵......
提出了一种自动检测C语言程序中是否含有死循环的方法.该方法基于程序分析技术,包括循环展开和路径可行性分析技术.该方法首先通过遍......
支持科学和工程计算的BLAS(基本线性代数子程序)在高性能计算中有着重要作用。本文针对Pentium Pro的体系结构特点,提出了一些优化方法使得BLAS在Pentium Pro上计......
软件流水是开发循环程序指令级并行性的技术,它通过并行执行连续的多个循环体来加快循环的执行速度.在软件流水中,循环体的重叠增......
存储系统与处理器之间的速度差距逐渐变大,为此,cache使用了分级机制,但这也带来了额外的存储延迟(cache代价).提出一种利用循环分割和循......
SIMD扩展部件是集成到通用处理器中的加速部件,旨在发掘多媒体和科学计算等领域程序的数据级并行.当前,两种基本的向量发掘方法分......
循环展开问题一直是过程式值言部分求值和广义部分求值的一个难题。笔者基于数据流分技术,提出了一个部分求值或广义部分求值的循环......
2.产品控制业务主线第二条业务主线是产品控制。第二条业务主线比较容易理解,它是沿着产品控制的循环展开的,就是产品的全成本控制......
软件流水和循环展开是开发循环并行性的两种重要编译优化技术.IA-64是支持软件流水的EPIC体系结构.论述了在IA-64编译器中结合使用......
构建了面向分簇体系结构的模调度编译框架.介绍了分簇结构和支持向量化执行的体系结构的机器资源描述方法,研究了模调度和循环展开......