面向便携式应用的神经网络加速器设计

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:a328623784
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,半导体技术的飞速发展使得芯片内晶体管数量按几何倍数增加,在大规模高速计算平台的支持下,深度神经网络(DNN)技术取得了突飞猛进的进步。通常的DNN运算包括两个阶段,推理和训练。对于用户而言,DNN的结构与参数需要在使用过程中更新,兼顾推理与训练的神经网络加速器就显得尤为必要,本文针对上述问题对可实现片上学习的神经网络加速器硬件设计进行了研究。主要工作内容如下:1.深入分析了深度神经网络推理与训练中涉及的运算,并抽象为数学模型,提出了针对不同类型运算的加速方法。重点对训练中的参数更新过程进行解析,对矩阵转置乘运算和大尺寸卷积核参与的卷积运算提出硬件加速方法。硬件电路经过适当调整和与算法适配,可以使用统一的运算器兼容所有运算类型。2.使用硬件电路实现两种卷积加速算法。针对卷积层在推理和训练过程中两种卷积运算的特点,分别采用卷积降维和矩阵乘形式卷积进行加速,并构建片上的离散式缓存结构对数据进行预处理,达成高效的算法实现。3.设计适配多种运算类型的可重构运算阵列,在运算单元内构建片上离散式数据缓存结构,减少系统与片外存储器间的数据交互,提高数据重复使用率。通过指令对运算器中的寄存器地址规则、数据路径、运算功能进行重构,使其可以满足多种运算需求。4.针对不同运算模式,设计可以通用的计算阵列并完成硬件实现,在FPGA芯片进行功能验证和性能测试。通过单指令加速效果验证、手写数字识别网络和自动驾驶决策网络进行实验,最终得到系统实现与性能的测试结果。
其他文献
近年来,在我国新型城镇化战略规划下,我国城市化进程不断加快,棚户区的存在成为城市化进程中的一大阻碍。为实现我国新型城镇化战略目标以及提升棚户区居民的生活幸福感,棚户
基于口令的认证方法因开销小、使用便捷,故成为目前使用最广泛的身份认证方式。正是因为使用简单,口令也一直存在着严重的安全问题:(1)来自不同语言的口令集具有明显不同的字
遥感图像是国防、航天、城市规划等多个领域所需的一类重要数据.遥感图像处理已受到众多学者的广泛关注.在机器学习算法盛行的潮流下,如何将机器学习与遥感图像处理相结合,以
域自适应学习是当前机器学习和模式识别领域一个研究热点,随着深度学习研究的不断进步,人工手选特征的时代即将结束。深度学习可以以最佳的方式自动从原始数据中提取到具有代
当前我国经济正在从高速增长阶段转化为高质量发展阶段,区域之间、城乡之间发展存在一定的差距,物质文明建设和精神文明建设、经济建设和国防建设之间存在不协调的状况,发展
机器视觉图像中的雨线、雨滴或水滴的存在,将直接影响图像背景的清晰度,对监测系统性能造成很大的影响。如何有效地去除图像中的雨线、雨滴或水滴,提高图像的质量,是需要解决
本文是基于笔者对David Johnston的作品The idea of Canada:Letters to a Nation进行的翻译所撰写的实践报告。翻译原文来源于加拿大总督为自己的国家所写的信件。展现了他一
身份认证是保护计算机系统安全的重要手段,传统身份认证方法的认证因素具有易遗忘、易泄露和易丢失等缺点,而基于鼠标行为的身份认证方法不需要额外设备,方便用于持续身份认
当前,国内外对青年科学家的培养工作极为重视,而青年科学家个体层面的学术绩效评价与预测也成为困扰科学界的一个难题。随着科学计量学的蓬勃发展,文献计量评价指标迅速兴起,同行评议制度受到到挑战,科学家个体层面的绩效评估从单一的同行评议逐渐向采用评价指标进行客观、公正、全面评价的方向发展。文献计量指标发展到现在已趋于成熟,演化为五代指标,为科研评价和绩效评估提供了扎实的理论基础,但其在科研评价中的有效性还
多视角立体(Multi-view stereo,MVS)重建是计算机视觉、图像处理等领域中一个基础又重要的研究课题,在增强现实、自动驾驶、城市规划、3D打印以及数字文物等领域发挥着至关重