双精度浮点矩阵乘协处理器研究

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:WYH5198
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
矩阵乘运算在多个应用领域特别是数值计算领域被广泛使用,但双精度浮点矩阵乘在CPU,GPGPU,FPGA等现有计算平台上的性能和效率受限,其往往成为大规模数值计算应用的性能瓶颈.针对该问题,以线性阵列计算结构为基础,研究了双精度浮点矩阵乘的定制加速.首先,对线性阵列计算结构进行了双缓冲优化并设计了针对双缓冲的存储访问调度,以提高结构的计算效率.其次,提出了矩阵乘协处理器和加速计算系统的结构,构建了协处理器的性能模型并对其结构设计空间进行了探索.最后,验证了协处理器的功能正确性并在某主流工艺下评估了其硬件开销
其他文献
目的探讨内镜下高频电凝电切术治疗结肠息肉的临床疗效。方法随机将2017年9月至2018年9月本院收治的94例结肠息肉患者分到观察组(n=47例)和对照组(n=47例),观察组患者予以内
目的:评价可吸收Bio—Gide膜与不可吸收钛膜在牙种植中骨再生修复的方法和效果。方法:对牙槽骨骨量不足的牙种植采用植Bio—Oss骨粉或自体骨,随机盖Bio-Gide膜与钛膜各30例,进行
目的探讨失眠症实验室客观检测指标;方法通过睡眠剥夺大鼠模型,检测大鼠脑脊液及血清PGD2、血清中5-HT、TSH、NE、CORTISOL水平;结果睡眠剥夺大鼠脑脊液及血清中PGD2含量高于
会议
随着中国经济融入全球市场的程度越来越高,越来越多的中国企业开始了自己的全球化历程。作为制造业的关键行业之一,装备制造业在中国已得到了长足发展,但由于多年同质竞争,缺乏高端制造技术,中国市场内部的装备制造行业竞争越来越激烈,各个企业呈现出大而不强的特点,对外则在国际市场缺乏影响力,主要依靠低价抢占市场,在高端制造业领域则竞争乏力。在这样的行业背景下,中国政府提出了“一带一路”倡议,这一倡议突破原有国
目的:本研究主要对比硼替佐米和长春新碱联合地塞米松、沙利度胺对多发性骨髓瘤患者免疫功能、机体炎症反应、肾功能、骨髓瘤细胞及M蛋白的影响。方法:选取在我院接受治疗的6
噻吩及衍生物基团具有独特的光电性能,已广泛应用于有机太阳能电池的设计与合成中,并在有机光电领域发挥着重要的作用。本文综述了近几年来含有噻吩及其衍生物的有机小分子太
依托某大跨度连续刚构桥施工栈桥,在计算栈桥在施工期间受力状态的基础上,分析洪水作用下栈桥的稳定性,探讨增强结构稳定性的措施.结果表明,桥面横梁应设置于贝雷梁节点位置;
革命纪念馆是为纪念1840年鸦片战争以来中国革命史上重大事件或杰出人物而建立的纪念性博物馆,是我国博物馆事业的重要组成部分.它们一般依托特定的革命遗址、纪念建筑(以下
目的 探讨不同固化方法处理后对复合树脂抗压强度的影响。方法 采用光固化、光固化+光固化、光固化+热固化,3种不同固化方法处理3M和贺利氏复合树脂,在万能验试机上测试抗压强度
一九七七年,日本林业机械化协会受林野厅(研究普及课)委托,试制成功坡地拖拉机。其主要技术参数知下:总重量:2,650公斤走行速度:前进、后退最高速度均为 In 1977, Japan Fo