CNN卷积计算在移动GPU上的加速研究

来源 :计算机工程与科学 | 被引量 : 11次 | 上传用户:imafool2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
卷积神经网络(CNN)凭借其优秀的表现正在诸如图像分类、语音识别等领域里扮演着越来越重要的角色,已经有一些研究人员想要将这个深度学习过程复制到手机上。但是,由于CNN巨大的计算量,移植程序的性能一直难以令人满意。为了探讨如何解决这一问题,借助MXNet这样一个深度学习的框架在手机上实现了CNN的前向过程,并且将注意力放在了使用手机上另一个强大的计算设备——GPU上。最终选择使用OpenCL通用编程框架将前向过程中最耗时的卷积操作利用矩阵乘来完成,并转移到GPU上进行。在此基础之上还针对手机GPU做了
其他文献
法国米其林公司根据我国道路状况专门设计的ENERGYXM2韧悦轮胎正式推出。其采用了多项米其林创新技术,在安全性和坚韧性方面表现尤为出色。
从2009年5月15日起,中国新一代极轨气象卫星“风云”三号卫星数据存档与服务系统正式对外提供服务。用户和社会公众可以通过数据分发系统或登陆共享服务网站、国家卫星气象中
基于动态身份信息ID的远程用户身份认证方案,在保证远程用户身份匿名性及不可追踪性的前提下,可实现远程用户与服务器端的双向身份认证。对Yang提出的基于动态ID的远程用户身
世界水资源的过度利用和滥用,已造成全球范围内无污染淡水供应的持续紧张。积极寻找替代水资源的解决方案,成为愈来愈多国家的重要议事日程。目前,经济上可行的替代水资源主要有
随着问题规模的增大和对实时性要求的提高,SIMD向量处理器尤其是带有向量运算单元的处理器在业界得到广泛应用。处理器上程序的运行状态一般由编译器通过堆栈进行管理。已有
美国国家航空航天局的新型“全球鹰”无人机将跨越太平洋,进行它的首次航行。据报道.新型“全球鹰”无人机的设计飞行高度约达2万米.持续飞行时间超过30小时。该无人机可实现远
数据中心租户使用的遗留设备中仍存在没有实现显式拥塞通知ECN的情况,导致数据中心网络中存在ECN流抢占非ECN流带宽资源的不公平现象。虚拟拥塞控制方法通过修改数据包接收窗
Mediator是一种基于组件的建模语言,该语言主要通过自动机和系统对模型进行描述。将Mediator语言描述的模型自动生成为可执行代码,可以避免编码过程中由于人为疏忽而造成的错
德国DILAS公司推出了一款最大输出功率可达6kW的新型光纤耦合多阵列模块。该模块采用微通道冷却,输出波长为9xxnm,采用数值孔径0.22μm、芯径1000μm的光纤。其不但拥有千瓦级的
随着云计算的快速发展,云文件系统在云计算基础设施中扮演着越来越重要的角色。尽管目前业界已有不少面向云文件系统的性能评测工具,但大多数评测工具仅关注于传统的系统性能指