多核多SIMD体系结构的自动向量化代价模型研究

来源 :第十八届计算机工程与工艺年会暨第四届微处理器技术论坛 | 被引量 : 0次 | 上传用户:qq460423406
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  高性能微处理器已进入了多核甚至众核时代.SIMD体系结构也已经成为高性能微处理器内核中普遍实现的细粒度数据并行体系结构.编译器利用自动向量化技术开发SIMD并行性能,已经成为主流编译器中重要的编译优化工作,自动向量化代价模型判定程序段向量化是否有收益,编译器据此决定是否对程序段进行向量化.面向多核多SIMD体系结构,在多线程并行和多SIMD并行同时存在的情况下,设计了新的编译器自动向量化代价模型,丰富扩展原有主流编译器的自动向量化代价模型,为并行编译器的自动向量化提供了新的考量.
其他文献
  中断是为使处理器具有对外界异步事件的实时处理能力而设置的.设计及优化DSP的中断控制系统和最小化中断响应时间成为DSP设计过程中的一个重要的方面.本文基于M-DSP设计
会议
  对处理器设计的验证方法可分为软件方法和硬件方法。众核体系结构处理器的逻辑规模较大,软件方法验证速度较慢,一般采取使用FPGA搭建原型系统验证。在实践过程中发现,硬
会议
针对DSP芯片面临的"存储墙"挑战,根据指令和数据的失效特点,基于YHFT-XDSP芯片设计实现了一款带有数据过滤机制的分离式预取部件.与传统的基于减小Cache失效率的预取优化策略
随着应用需求的增加和芯片集成度的提高,处理器设计已经进入多核时代,同步机制对多核系统性能的发挥至关重要.为此,本文基于一款自主设计的12核向量DSP平台,实现了包含读写锁
人类细胞色素P450(Cytochrome P450,CYP)对许多内源性和外源性的化学物质及环境有害化学物质具有生物转化作用。其中CYP1A2是P450酶系重要的亚族之一,约占肝脏CYP酶总量的15%,居肝脏各CYP酶含量的第三位。CYP1A2参与许多前致癌物的代谢激活作用,CYP1A2还代谢多种药物,同时也负责一些内源性激素的羟化反应。CYP1A2活性存在很大的个体间差异,其遗传多态性有可能会
  TSMC (Taiwan semiconductor Manufacturing Company) 20nm is considered as an extremely complex technology with many more design rules, more electrical variati
会议
  The dual interlocked cell (DICE) is known immune to single node strike because of its redundant structure.However, it is sensitive to multiple nodes strike.
会议
  Matrix2是由国防科学技术大学微电子所自主研发的一款用于无线通信领域的高性能DSP处理器,具有创新的体系结构和指令集.LLVM编译架构起源于美国伊利诺斯大学,是开放源代码
  随着多核处理器成为主流,高性能片上网络(NOC)成为实现多核间互连的重要方法,用于片上网络的接口设计对于实现无阻塞的核间通信至关重要。本文基于某多核处理器的片上环形
季节性冻融土壤系统与外界不断进行着物质和能量的交换,同时水热盐在该系统中进行着复杂的运动。为了揭示季节性冻融期水氮用量组合对土壤水热变化及硝态氮迁移的影响,本次研究