基于嵌入式多核处理器Epiphany的矩阵乘算法实现与评测

来源 :第十九届计算机工程与工艺年会暨第五届微处理器技术论坛 | 被引量 : 0次 | 上传用户:eponvlan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  嵌入式多核处理器在国防军事、消费电子、车载通信领域具有广泛的应用前景,但是要发挥嵌入式多核处理器高效的计算能力,需要在任务划分、数据通信等方面进行大量的优化工作。本文以片上多核嵌入式处理器Epiphany为平台,研究嵌入式多核处理的并行编程和优化问题。本文基于标准C和OpenCL两种语言实现了面向该多核处理器的矩阵乘算法,并进行了针对性优化。实验结果表明,基于标准C的实现能够更好的利用处理器的浮点计算能力。基于OpenCL的实现由于无法利用核间的高效通信能力,性能无法与基于标准C的实现相比,但是OpenCL程序具有更好的平台可移植性。
其他文献
冻融作用对土体工程力学行为的影响是岩土工程领域中一个重要的研究课题。土体受到冻融循环作用后,由于冻融过程中冷生作用的影响,土体的结构的变化会导致其物理力学性质发生
  分支指令带来的延迟开销是影响芯片流水线效率的关键因素,基于分支延迟槽调度是降低其延迟开销最有效的方式[1]。论文分析了GCC中分支延迟槽调度算法及其存在的不足,然后并
由于近些年来我国多次遭受地震灾害,造成巨大的人员伤亡和经济损失,所以建筑的隔震减震设计在实际工程中显得至关重要。本文对原有钢筋-沥青隔震技术进行适当创新,将其引入低
  随着IC规模的快速发展,传统的Verilog验证已经难以满足验证的需求。基于SystemVerilog的验证方法学能够快速地找出设计的漏洞,并具有很强的重用性。本文以"M-DSP"内核L2部
会议
  在多处理器互连的领域中,Rapid IO发挥着重要的作用.数据消息引擎(DME)作为其中的一种传输方式,有着其他模式不可替代的优点.在传统的传输方式中,发起者需要知道数据搬移
纳米碳纤维(Carbon Nanofiber,CNF)具有纳米级尺寸、大长径比、高强度及低电阻率等优点,将其均匀分散到混凝土中会很大程度上改善混凝土的力学性能与电学性能。国外研究表明:纳米碳纤维混凝土(Carbon Nanofiber concrete,CNFC)具有良好的压敏效应,将其作为压敏传感器用于重大工程的健康监测不仅克服了传统型埋入式传感器与混凝土的相容性问题,还很大程度解决了采集信号系
  本文介绍了一种在UVM验证平台的基础上,利用遗传算法分析功能覆盖率信息,指导生成测试激励,建立从覆盖率到测试生成的闭环系统,与普通的约束随机激励生成方法相比,激励生成不
干旱区由于有限的水资源、人工绿洲的存在往往以牺牲自然绿洲的面积为代价,而人工绿洲又往往发展于水环境较好的上中游地区,从而造成水流流程缩短、下游断流等现象出现,使得该地
在常永涛眼里,担纲天治基金总经理助理、投资总监如同翻开了人生的新篇章,2010年作为中国基金业新变革的元年,勇于挑战自我的常永涛,坚定地踏上了这场新变革的征程。     重如山的责任感    上任伊始,常永涛就做了一件让天治基金所有投研人员都刻骨铭心的事情,目的只有一个:增强投研团队的社会责任感。  “对普通基民来说,基金经理犹如养在深闺人未识,而基金经理如果也同样体会不到基民的感受,责任感就比较
  本文针对FFT计算中旋转因子产生延时过长的问题,采用一种基于旋转预测和保留进位加法器(CSA)的压缩迭代的CORDIC算法及结构,设计实现了低延时的FFT旋转因子产生模块。实验