面向片上系统的神经网络设计和实现研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:abc747665
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着半导体制造技术的飞速发展,集成电路可以在单一芯片上实现信号采集、处理、存储以及I/O等多种功能,这种系统级集成电路又被称作片上系统(SoC,System on Chip)。SoC在单一的芯片上实现了系统级的各个功能模块,具有高速度,高集成度和低功耗的特点,同时很大程度上缩减了产品的体积和成本,因此被广泛应用于通信、控制以及多媒体等各个领域。深度神经网络被广泛用于图像检测,语音识别和自然语言处理等领域。由于深度神经网络模型越来越复杂,其对计算能力的要求也越来越高。然而片上系统多用于嵌入式领域,有着严格的性能和功耗限制,因此如何在片上系统(嵌入式系统)上应用神经网络成了一个亟待解决的问题。本文从以下三个方面对片上系统的神经网络应用问题进行了相关的研究:第一,片上系统是高度集成的嵌入式系统,由于面积和功耗等方面的限制,在片上系统上应用深度神经网络一般采取先在云端训练训练模型然后迁移到嵌入式设备上使用的方法。本文通过搭建深度神经网络模型并将公共数据集上训练好的模型用于个人化的数据集,验证了本地再训练的必要性。对于本地再训练过程中很难收集到有标签的数据的问题,本文提出了基于用户正确性反馈的训练方法,即虽然很难要求用户手动指定训练样本的标签,但是用户却可以对神经网络的推断结果做出一个反馈,“推断正确”或“推断错误”,然后根据用户的反馈生成对应样本的标签从而用于神经网络的训练。第二,基于专用指令的神经网络加速器和基于层的加速器设计相比具有灵活度高,扩展性强的特点。而独立的加速器实现需要额外的译码单元和编译器等软硬件资源,本文提出利用自定义指令来设计加速器的专用指令,这样加速器和CPU共享译码单元和编译器,同时两者之间通过协处理器接口紧耦合,具有更高的通信效率。第三,由于定点表示法相比与浮点表示法占用存储空间少,计算电路实现简单,所以本文的加速器实现采用了8位有符号定点数。但是定点数小数点位置固定,表数动态范围有限,计算结果很容易超出其表示范围。针对这个问题,本文给定点数引入了动态机制,即参与计算的每个向量内的元素小数点位置相同,不同的向量小数点位置可以不同。这样可以根据每个向量的数据范围设置小数点位置。
其他文献
矿山开发带来巨大经济效益的同时,势必会带来一系列严重的矿山环境风险。堆积如山的弃渣尾矿、矿山次生地质灾害(危岩体崩塌、滑坡、泥石流等)以及矿区水土流失、水土体污染等矿
目的观察加味四逆汤治疗慢性心力衰竭心肾阳虚证的临床效果。方法选择2016-01~2017-02该院收治的慢性心力衰竭心肾阳虚证患者100例,按随机数字表法将其随机分为观察组和对照
目的:探讨穴位按摩及腹部按摩在急性心肌梗死患者便秘治疗中的临床效果及护理经验,进一步提高护理质量。方法:2011年1月-2014年1月收治急性心肌梗死并发便秘患者185例,随机分
县级财政是中国财政层级中的基本组成部分,也是县级政府实现其职能的重要工具,其收支活动随着国家财政体制和县政府职能的转变而变化。新中国成立后的第一年,在财政体制方面
本文通过聚丙烯酸甲酯树脂与过量的乙二胺反应,形成含有伯胺基的聚丙烯酰胺树脂,然后再与氯乙酸反应,形成含有亚胺二乙酸基团的树脂(凝胶型和大孔型)。研究了聚丙烯酸甲酯树
注重学生的实践体验、亲身经历,是综合实践活动区别于其他各类课程的根本特点。基于此,文章根据学生的成长需要,提出了让学生在实践活动中丰富阅历、获得经验、有所感悟,从而
自创客教育在中国兴起以来,创客教育已成为一个热点话题。各级政府、各教育主管部门、全国中小学和教育专家都对创客教育从理论到实现付出巨大努力,几年过去了,我国的创客教
目的 调查外科手术患者围手术期抗菌药物预防使用现状,进一步推动围手术期预防用药合理化。方法 对931例Ⅰ类与Ⅱ类手术切口患者围手术期抗菌药物使用情况进行回顾性调查。结
[目的]观察穴位按摩配合辨证施膳预防、治疗急性心肌梗死病人便秘的临床疗效。[方法]选取90例急性心肌梗死病人作为研究对象,随机分为两组(每组45例),对照组实施常规护理,观察
采用Instron5882万能材料试验机和正交试验法研究了Sr、Mn和Fe对ZL102合金力学性能的影响。结果表明:在本试验范围内,Fe、Mn和Sr的加入量对ZL102合金力学性能的影响从大到小