面向MobileNetV1的高能效加速器架构设计

来源 :浙江大学 | 被引量 : 0次 | 上传用户：nilly

【摘要】

：

【作者】

：

求天楠

【机构】

：

浙江大学

【出处】

：

浙江大学

【发表日期】

：

2021年01期

【关键词】

：

MobileNet 深度可分离卷积加速器指令集高能效

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

卷积神经网络（Convolutional Neural Network）是深度学习（Deep Learning）的一种基础模型,具有计算存储密集型的特点。其中,基于深度可分离卷积的MobileNet系列网络是轻量化网络的典型代表,其利用深度分离卷积将标准卷积的计算量和参数量减少至近1/9,大大缩小了网络模型,相对其他大型网络更适合在移动终端部署。移动终端通用处理器在执行神经网络推理任务时,普遍存在能效低下,实时性不足的问题。本文面向移动终端的应用场景,研究设计了一种面向MobileNetV1的高能效加速架构。论文的主要研究内容和特点如下:1.介绍了卷积神经网络相关的基础知识,对深度可分离卷积缩小网络模型的原理做了阐述说明,选取轻量化网络MobileNetV1为本文的加速对象。2.分析了MobileNetV1网络的主体结构,提出一种以层操作为描述对象的专用指令集。指令集以32位编码完成单层运算所需信息的全部映射,使指令集更贴近网络的软件模型,提高代码密度的同时为软件编程提供便利。3.基于指令集,提出了面向MobileNetV1的可编程专用加速器。针对大规模片上输出缓存利用率不高的问题,加速器基于通道维度优先的数据存储方式,利用卷积运算的时间局部性,设计了一种在小规模输入缓存中实现数据高效复用的迭代控制方案,提高了访存效率和缓存行利用率,简化了存储结构。此外,通过复用一维乘累加阵列、使用简易浮点比较器实现Re LU6等多种优化手段,节省了加速器的资源开销。4.对专用指令集和加速器架构进行评估。本文专用指令集具有高代码密度和易用性的特点。在TSMC 28nm工艺下,加速器总面积为0.275mm~2,在1.25GHz的工作频率下,总功耗为63.7m W,可以5.0fps的速度执行MobileNetV1网络推理任务。

其他文献

基于聚类特征与主动学习的用水用户标签清洗方法

用户的用水类型是供水企业对用户用水收费的重要标准。用户用水类型标签作为供水企业对用户定价的关键凭证,在用户的用水类型申报、供水企业的运营减负及利润保障上起着极为重要的作用。然而随着供水产业改革以及用户规模扩大,用户用水标签错标、标签无法随用户用水性质自动更新等问题日益加剧。供水企业客户基数大、用户长期流动、变动频繁,同时运营资金投入少、人工维护困难等问题使大数据量下用水用户标签的更新和清洗难以实现

学位

特征工程聚类特征主动学习标签清洗

基于深度学习的鱼类表型数据测量方法研究

鱼类及其相关产品是人类饮食食谱上蛋白质的重要来源之一,渔业的健康发展与人们的生活密切相关。优良的鱼种资源是渔业可以持续健康和快速发展的基础,育种和优选是渔业养殖过程的关键环节。鱼苗的优选除了依靠一些生化指标外,鱼苗的表型数据也是鱼种优选的重要参考指标。目前鱼育种的研究机构多采用人工测量方法获取鱼苗的表型数据,这个过程费时费力且易出错,同时难以获得全面的表型数据。为了帮助研究人员快速准确的测定鱼苗的

学位

计算机视觉表型数据非接触式测量关键点检测

基于深度强化学习的敏捷成像卫星任务规划方法

敏捷成像卫星具有较强的姿态机动能力,相比于普通成像卫星具备沿俯仰轴侧摆的能力,对于地面观测目标可产生更长的可观测时间窗口。随着敏捷成像卫星应用领域的不断扩大和用户任务需求的不断增加,如何对输入的用户任务序列进行规划,制定出合理有效的任务执行序列,充分发挥敏捷成像卫星的运行效率,对实现敏捷成像卫星在轨运行的自主化、智能化具有重要的意义。本文围绕敏捷成像卫星任务规划问题,建立了带有时间窗口约束的敏捷卫

学位

敏捷成像卫星任务规划问题组合优化Pointer Networks深度强化学习

面向分类任务的神经网络架构搜索算法研究

近年来,由于计算机算力的快速发展,深度学习（Deep Learning,DL）算法已经成功地应用于各式各样的场景中。其中,卷积神经网络（Convolutional Neural Network,CNN）的提出使得图像领域的许多复杂问题得到了解决,例如图像分类、图像分割等问题。然而,对于一个分类任务而言,一个模型在某个数据集上表现出色并不代表其在其他数据集上表现同样出色。随着数据量的急剧增长,神经网

学位

卷积神经网络增强拓扑的神经进化强化学习蒙特卡洛树搜索NASBench-101

基于深度学习的低照度图像去噪和增强算法研究

近年来,智能手机相机已经成为人们日常生活的必备工具之一,获取高质量的照片也逐渐成为了人们追求的目标。然而,在诸如夜晚或者照明昏暗的低照度场景下,相机捕获到的图像往往存在噪声大、对比度低,细节和色彩大量丢失的问题。这不仅会严重影响人眼的视觉效果,还会影响很多计算机视觉相关的应用,如人脸识别和安防监控。本文的研究目的是针对低照度图像进行去噪和对比度增强算法的研究。基于深度学习算法和一些经典的低照度图像

学位

图像去噪低照度图像增强深度学习Retinex理论模型压缩

对抗网络中安全的分布式自适应扩散估计算法研究

随着无线网络的应用、芯片集成度的提高与计算能力的增强、以及信号处理技术的进步,基于无线传感网络（Wireless Sensor Network,WSN）的分布式信息处理技术受到学者与产业界的关注,成为了研究热点。分布式自适应算法因结构简单且易于实现的特性,被广泛地应用于解决分布式参数估计的问题。分布式自适应网络是由一组具有数据处理和通信能力传感器节点组成,通过自适应算法和节点间协作进行目标参数的估

学位

无线传感网络分布式参数估计自适应算法扩散最小均方算法错误数据注入攻击

麦克纳姆轮结构移动机器人的室内定位和路径规划

随着人工智能和传感器技术的发展,移动机器人在仓储物流、家庭服务、教育科研等领域的应用越来越广泛,室内定位与路径规划技术是移动机器人应用于具体领域的重要基础。对于空间相对较小的室内场景,基于麦克纳姆轮的移动机器人可以全方向无约束地运动,具有良好的机动性和灵活性。因此,本文研究麦克纳姆轮结构移动机器人的室内定位和路径规划对移动机器人在室内场景下的应用具有重要的意义。本文的主要工作如下:首先搭建了麦克纳

学位

移动机器人ROS室内定位路径规划

基于深度学习的小尺度麦克风阵列多语音源辨识方法研究

语音交流是人类沟通交流最有效的方式之一。多说话人场景下噪声、混响和多声源之间的混叠,使得对多语音源的混合信号进行声源定位和语音分离变得更具有挑战性。本文针对小尺度麦克风阵列,对含有多个语音源的远场语音信号进行定位和分离研究。为了提升小尺度麦克风阵列上的语音信号定位性能,提出基于卷积神经网络（Convolu-tional Neural Network,CNN）的多语音源到达角（Direction o

学位

深度学习到达角估计声源计数语音分离小尺度阵列

基于信道建模和拓扑控制的移动水声传感器网络协议研究

随着水声通信技术的不断发展和水声通信设备、水下移动平台的日益成熟,移动水声传感器网络在水下信息感知与传输中承担了越来越重要的角色。凭借着水下移动平台的机动性,移动水声传感器网络能够实现对海洋环境的大范围实时观测,为重点海区的长期水下监测和安全时效预警提供保障。移动水声传感器网络不仅要考虑水声通信有限带宽、长时延和低速率等特性,同时还需要承担移动节点带来的网络结构和通信链路质量的动态变化。因此,需要

学位

移动水声传感器网络信道建模多径效应拓扑控制媒体接入控制机会路由

基于深度神经网络的立体图像和视频校正

随着3D技术在日常生活的普及,3D游戏、3D电影等成为人们日常生活中的重要娱乐项目。然而人眼长时间观看某些3D影像后会出现眼睛疲惫、头疼、注意力难以集中等生理不舒适症状。其中垂直视差是观看者产生视觉疲劳的重要因素之一。因此在实际应用中,拍摄后3D影像都需要经过后期处理来进行校正。传统外极线校正的方法对3D影像的左右视图施加投影变化,使对应的外极线处于同一水平线,从而实现垂直视差的消除。然而传统无相

学位

垂直视差立体图像校正立体视频校正

面向MobileNetV1的高能效加速器架构设计

与本文相关的学术论文