一种面向神威·太湖之光的通用并行卷积算法

来源 :计算机工程 | 被引量 : 0次 | 上传用户:feng861013
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
神威·太湖之光深度学习库中的并行卷积算法存在批量受限的问题,且传统gemm卷积算法在其硬件架构上效率较低。基于申威异构众核处理器,提出一种无批量限制的通用并行卷积算法。结合异步DMA访存操作和从核间的寄存器通信,使用数据重用和软件流水等方法降低从核访存开销,利用手动向量化的方法充分发挥从核浮点的计算能力。实验结果表明,与基础7层循环算法、gemm算法和Intel平台上的MKL-DNN算法相比,该算法的加速性能较好。
其他文献
介绍了国外电镀锌钢板生产的发展过程和国内近几年的新建情况,并根据市场和现状的分析,提出了电镀锌机组产品定位应重点考虑高端耐指纹家电产品的建议。
《矿山爆破》是高职院校金属矿开采技术专业的核心课程之一,我们以培养能适应该课程相应岗位群的技能型人才为目标的教学理念,通过就业岗位群与职业能力分析,总结出该课程总
报刊集萃农村职业技术教育滑坡的原因及对策滑坡的原因主要有:①办学多元化使生源得以分流。②用人单位追求高学历和“正品”毕业生,使职高毕业生就业难。③专业设置与社会需求
<正>形状记忆聚合物(SMP)在具有形变大、质轻等突出优点的同时也有力学强度低、电磁功能缺乏等缺点。添加功能性无机或金属填料制备SMP复合材料(SMPC)是提高性能的基本策略。[1]
会议
"海峡两岸国学与社会生态治理论坛"(笔谈)是由来自台湾大学哲学系的杜保瑞教授和来自东北地区各高校几位教授共同组织的一次学术研讨活动,论坛试图由中华传统文化为切入视角,探讨
回顾和总结了植物补偿与超补偿的定义与观点,并且根据前人对放牧草地植物补偿与超补偿效应的研究,分析了补偿与超补偿效应的机制和影响补偿作用的因素,用生长冗余理论揭示了补偿
优生优育营养咨询系统软件的研制*郭松超1黄衍信2唐琦3林葵2何聿忠21997-04-05收稿。1997-10-05修回。*本课题由广西壮族自治区科委自然科学研究基金资助1广西医科大学营养与食品卫生学教研室(南宁530021)2广西分析
笔者选用十五年来以社区教育为研究主题的硕士论文共计649篇,首先采用文献计量学方法,对社区教育的人才培养历史规模、机构贡献、学术带头人、学术传承脉络、关键词使用趋势
蛟龙号载人潜水器于2012年完成了7000米级的海试.标志着我国跻身掌握深潜技术的少数几个国家之一,取得了第二代栽人潜水器最大下潜深度的记录。蛟龙号海试的成功离不开研制过程