CNN卷积计算在移动GPU上的加速研究 - 论文文献免费下载 - 搜论网

CNN卷积计算在移动GPU上的加速研究

来源 :计算机工程与科学 | 被引量 : 11次 | 上传用户：imafool2009

【摘要】

：

卷积神经网络(CNN)凭借其优秀的表现正在诸如图像分类、语音识别等领域里扮演着越来越重要的角色,已经有一些研究人员想要将这个深度学习过程复制到手机上。但是,由于CNN巨大的计算量,移植程序的性能一直难以令人满意。为了探讨如何解决这一问题,借助MXNet这样一个深度学习的框架在手机上实现了CNN的前向过程,并且将注意力放在了使用手机上另一个强大的计算设备——GPU上。最终选择使用OpenCL通用编程

【作者】

：

王湘新时洋文梅

【机构】

：

武警湖南省消防总队信息中心,国防科技大学计算机学院

【出处】

：

计算机工程与科学

【发表日期】

：

2018年01期

【关键词】

：

CNN 手机移动GPU 快速算法 OPENCL

【基金项目】

：

国家自然科学基金（61272145）

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

卷积神经网络(CNN)凭借其优秀的表现正在诸如图像分类、语音识别等领域里扮演着越来越重要的角色,已经有一些研究人员想要将这个深度学习过程复制到手机上。但是,由于CNN巨大的计算量,移植程序的性能一直难以令人满意。为了探讨如何解决这一问题,借助MXNet这样一个深度学习的框架在手机上实现了CNN的前向过程,并且将注意力放在了使用手机上另一个强大的计算设备——GPU上。最终选择使用OpenCL通用编程框架将前向过程中最耗时的卷积操作利用矩阵乘来完成,并转移到GPU上进行。在此基础之上还针对手机GPU做了

其他文献

米其林ENERGYXM2韧悦轮胎推出

法国米其林公司根据我国道路状况专门设计的ENERGYXM2韧悦轮胎正式推出。其采用了多项米其林创新技术，在安全性和坚韧性方面表现尤为出色。

期刊

法国米其林公司轮胎道路状况创新技术坚韧性安全性

我国正式对外提供“风云三号”卫星数据及产品

从2009年5月15日起，中国新一代极轨气象卫星“风云”三号卫星数据存档与服务系统正式对外提供服务。用户和社会公众可以通过数据分发系统或登陆共享服务网站、国家卫星气象中

期刊

卫星数据“风云三号”气象卫星产品极轨气象卫星服务系统数据存档

动态ID多因素远程用户身份认证方案的改进

基于动态身份信息ID的远程用户身份认证方案,在保证远程用户身份匿名性及不可追踪性的前提下,可实现远程用户与服务器端的双向身份认证。对Yang提出的基于动态ID的远程用户身

期刊

动态ID身份认证智能卡口令HASH函数dynamic IDidentity authenticationsmart cardpasswordH

欧盟新型水下机器人探寻替代水资源获得成功

世界水资源的过度利用和滥用，已造成全球范围内无污染淡水供应的持续紧张。积极寻找替代水资源的解决方案，成为愈来愈多国家的重要议事日程。目前，经济上可行的替代水资源主要有

期刊

淡水资源水下机器人欧盟地中海沿岸潜水机器人框架计划科技人员研究开发

一种支持SIMD体系结构的高效分布式堆栈——HEDSSA

随着问题规模的增大和对实时性要求的提高,SIMD向量处理器尤其是带有向量运算单元的处理器在业界得到广泛应用。处理器上程序的运行状态一般由编译器通过堆栈进行管理。已有

期刊

SIMD堆栈编译SIMD stack compile

美国新型“全球鹰”无人机将首航

美国国家航空航天局的新型“全球鹰”无人机将跨越太平洋，进行它的首次航行。据报道．新型“全球鹰”无人机的设计飞行高度约达2万米．持续飞行时间超过30小时。该无人机可实现远

期刊

美国国家航空航天局“全球鹰”无人机飞行时间飞行高度高空飞行远程遥控数据信息科学研究

面向数据中心租户带宽特征的虚拟拥塞控制方法性能分析

数据中心租户使用的遗留设备中仍存在没有实现显式拥塞通知ECN的情况,导致数据中心网络中存在ECN流抢占非ECN流带宽资源的不公平现象。虚拟拥塞控制方法通过修改数据包接收窗

期刊

拥塞控制显式拥塞通知传输控制协议数据中心网络congestion controlexplicit congestion notificationTC

Mediator模型的SystemC代码自动生成

Mediator是一种基于组件的建模语言,该语言主要通过自动机和系统对模型进行描述。将Mediator语言描述的模型自动生成为可执行代码,可以避免编码过程中由于人为疏忽而造成的错

期刊

MEDIATORSYSTEMC代码自动生成基于组件建模MediatorSystemCcode automatic generationcompon

新型光纤耦合多阵列模块最大输出功率可达6kW

德国DILAS公司推出了一款最大输出功率可达6kW的新型光纤耦合多阵列模块。该模块采用微通道冷却，输出波长为9xxnm，采用数值孔径0．22μm、芯径1000μm的光纤。其不但拥有千瓦级的

期刊

最大输出功率光纤耦合模块阵列AS公司数值孔径耦合效率DIL

面向云文件系统的隔离性度量方法研究

随着云计算的快速发展，云文件系统在云计算基础设施中扮演着越来越重要的角色。尽管目前业界已有不少面向云文件系统的性能评测工具，但大多数评测工具仅关注于传统的系统性能指

期刊

性能隔离云文件系统基准测试多租户环境performance isolation cloud file systems benchmark m

与本文相关的学术论文