基于ARM处理器的深度学习优化技术研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:afuren1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度学习模型的部署开始从原来的X86+GPU的大型服务器阵列逐渐迁移到智能手机,摄像头,传感器等这类ARM小型设备上。深度学习神经网络的层数较多,单个网络需要计算大量的数据。实时性和精确性的需求,对硬件的计算能力提出了很大的挑战。ARM设备相比同时期X86设备和GPU,其存在频率较低,计算速度较慢的问题,并且其核心数量、缓存大小、级数和内存空间往往不如后两者。这些问题使得在ARM设备上进行模型部署会遇到实时性不佳的问题。因此,本文提出了一种基于ARM处理器的深度学习优化的方法,对模型计算速率和存储空间使用作出了优化。本文从深度学习神经网络中的基本计算单元算子入手,优化GEMM算子和二维卷积运算算子。首先,以ARM Cortex-A72架构为目标架构,对其缓存的级数和每一级能容纳的数据量作出了分析。之后对GEMM算子计算耗费的次数,访存和写入操作的次数作出分析,并在此基础上解耦计算和数据调度,并使用分块策略来优化缓存使用率,在此基础上使用ARM NEON指令集来加速计算并减少读写操作次数,接着针对ARM处理器的流水线架构特征,使用指令重排列进一步优化流水线使用率。其次,对二维卷积算子的输入数据和卷积核数据展开成行向量并填充其数据量到4的倍数,将其内存访问模式改变为顺序访问模式,计算形式变更为GEMM计算,接下来使用与GEMM算子类似的策略对其进行优化。在对两个算子的计算速率和存储使用效率优化完毕之后,结合深度学习编译器TVM框架,将两个算子整合到TVM中,使得其能够参与实际深度学习模型的编译与部署,达到优化神经网络的效果。本文最后设计实验对单个优化后的算子和优化后的神经网络的计算速率、存储使用效率、预期使用周期数量等指标作出了测试,结果表明,本文的提出的优化方法能够有效提升算子和神经网络在计算过程中的缓存命中率和计算速度,验证了本文优化方法的有效性,在ARM架构上实现了一种对深度学习的优化方案。
其他文献
互联网的应用对人们的生活影响越来越大,科学地利用互联网技术,对地方政府治理有着重大意义。政务新媒体是移动网络中,党和政府与群众沟通、为人民服务、获取人民信任的重要渠道之一,是加速政府职能的转型、创建服务型政府的关键方式,可作为引导网上舆论、打造清净文明网络环境的重要阵地,是探索社会治理新模式、提升社会管理水平的一条重要途径。“十四五”规划中提到加速数字化发展,创造数字经济新优势,推动数字产业化和产
学位
全球导航卫星系统(Global Navigation Satellite System,GNSS)作为桥梁结构整体响应监测手段之一,随着技术提升日益受到人们重视。近年来,我国北斗卫星导航系统组网成功及北斗卫星的推广使用,为其应用于桥梁结构动态监测及安全评估领域奠定了基础。本文以主跨150m的下承式钢管混凝土拱桥—深圳北站大桥作为工程背景,尝试建立基于GNSS的桥梁结构模态参数识别与安全评估方法。本
学位
笔法是中国书法与绘画的主要元素之一,具有着极其重要的地位。董其昌作为山水画的集大成者,开创历史之先河,在继承古法的传统之上,探索笔法的艺术形态,推动了中国艺术史的发展。“笔法”二字贯穿董其昌的艺术理论与思想,其书画理论著作《画禅室随笔》与诗文别集《容台集》都有著录其对笔法的论述。董其昌视笔法为书画本质,是山水画的精神所在。其所述笔法,既是具体的用笔方法,亦是抽象的美学思想,其将理论与实践相结合,充
学位
随着云计算、大数据、人工智能等新一代信息技术快速发展,数据呈现爆炸式增长,而作为各类信息存储及应用基础的存储器成为了支撑信息技术快速发展的基础及有力支撑。而磁性非易失性存储器(MRAM,Magnetoresistive Random Access Memory)由于其可比拟半导体DRAM的存取速度及至关重要的对信息存储的非易失性,成为了新一代存储器研究的核心。其中,具有垂直各向异性的磁隧道结(PM
学位
近年来,国产影视剧在海外畅销,字幕英译的市场需求越来越大。影视剧字幕翻译研究受到了更多学者的关注,然而军事题材的字幕翻译方面少有人涉足。本翻译实践报告是译者基于在研究生就读期间,承接的影视剧《突击再突击》的字幕翻译项目,在交际翻译理论指导下对军事题材影视剧的字幕翻译研究。《突击再突击》是中央电视台、云文(北京)影业投资有限责任公司等联合出品的军事题材影视剧。该剧主要讲述了一群年轻新兵来到青藏高原,
学位
随着油气田开发的深入,我国油气储量自然递减,开发的难度逐渐提高,因此需要更精确的监测手段来完成油藏的精细描述及剩余油开发。井中地震勘探技术就是在这种背景下产生的。相较于传统的地面地震勘探技术,井中采集的地震信号具有信噪比高、有效波的分辨率高、勘探距离长等优点。因此针对井中地震勘探技术,研制井中地震遥测系统,精准采集和记录井中地震波信息,并以稳定、准确的传输方式完成数据的回收,为后续地震数据处理以及
学位
针对低渗透气藏储层非均质性强,有利区块分布零散,寻找有利富集区困难的问题,论文以苏里格气田东区主力层盒8段为研究对象,综合应用地质、测井、录井、岩心资料,在储层沉积相及储层特征研究的基础上,通过计算综合评价指数对研究区盒8段储层进行了综合评价,建立了系统的储层综合评价方法,为苏里格气田东区高效开发提供了技术上的支持。论文取得以下研究成果:(1)明确了盒8段储层主要发育陆相辫状河三角洲沉积,位于三角
学位
可持续发展是世界发展趋势,更是人们在新时代背景下对美好生活的诉求。联合国秘书长古特雷斯,在2018年12月2日第二十四届联合国气候变化大会上呼吁,全球努力到2050年实现“碳中和”,这就代表企业不应拘泥于传统的煤炭燃料,而是应乘上可持续发展的“东风”,加大清洁能源使用比例,降低燃烧传统燃料对环境带来的不利影响。由此,石油化工行业作为燃料消耗的重点行业更应该顺应全球发展,结合目前行业状况,积极主动制
学位
语言作为人类最重要的交际工具和思维工具,同人的心理活动密切相关,心理活动可以借助语言加以表达。认知心理动词是一类表征人类心理活动的动词,涉及人脑多种认知加工和信息处理过程,具有主观性、抽象性等特点。在国际中文教育中,教学内容是联系“教”与“学”两方面的核心与纽带,而教学内容直观体现在大纲及其指导下的教材中,学生的习得也具有一定特点和规律。据此,本文选取29个常用认知心理动词作为研究对象,尝试对其从
学位
近几年英语绘本在小学英语教学中占有很重要的地位。英语绘本也作为优质的教学资源,被越来越多的学校所采用。《义务教育英语课程标准(2011年版)》对小学中低年级设定的目标为“借助图片听懂、读懂、讲述小故事。因此小学英语教学如何将图文结合对于达成教学目标是非常重要的。英语绘本具有形式丰富、色彩鲜明、图像生动且语言规范特点等特点。小学低年级学生因为没有第二语言的学习基础,英语教学如果仅囿于课文讲解,学生很
学位