基于FPGA的残差网络研究与实现

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:huangmajun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,卷积神经网络在诸如图像分类、姿态估计等许多应用领域展现出优异的性能,在无人机和无人驾驶等场景中非常适用。但是,GPU作为最常见的深度学习平台,其较低的能效比导致它在功耗等方面有一定的局限性,因此不能满足这些嵌入式低功耗平台的使用条件,实际应用受到了限制。嵌入式的CNN需要资源需求更小、效率更高的实现方式,本文着重研究在FPGA平台上如何高效地实现深度卷积神经网络。随着网络深度的增加,普通网络会出现过拟合问题,而残差网络能够有效地解决这一问题并且在多项应用中均有着不错的效果。因此,本文在众多的神经网络架构中选择了残差网络。根据其捷径连接实现方式的不同,最终选择了一个以补零方式实现捷径连接的30层残差网络在FPGA上加以实现。针对FPGA硬件平台和残差网络的特点,本文进行了电路总体设计和各子模块的设计。所选网络每层的权重及输入/输出数据量较大,因此本文采用DDR对数据进行存储,并在读写DDR的过程中使用了Xilinx MIG IP核,避免了复杂的DDR直接操作。根据所选残差网络的结构及运行过程,本文对网络前向推理部分进行了设计,在所选网络中,全连接层和最大值池化层等仅出现一次,而残差块结构则多次出现,本文在设计中充分考虑了计算单元在各残差块之间的复用。此外,由于网络中全局池化操作与捷径连接中的池化操作类似,本文考虑了它们之间运算单元的复用,节省了硬件资源。在所选网络的前向推理过程中,3×3的卷积运算占了绝大部分,本文在处理单元模块中将该运算完全展开,以加快网络运行速度。由于所选网络的参数量较大,且运算过程中对各参数使用频繁,为了减少读取数据的时间开销,本文采取了片上缓存策略,每次从DDR中读取网络单层的权重和偏置参数,存储在片上的BRAM中,最大化片上数据复用,避免反复访问片外存储。本文对所设计的电路进行了仿真和验证,并与软件实现方案的运算结果进行了比对,结果表明,所设计的系统功能正确,且具有能耗低,消耗硬件资源较少等优点,能够满足一般嵌入式低功耗平台的应用条件。而且本文针对残差网络架构所做的FPGA电路设计具有一定的通用性,经过适当修改,可以推广到其他类似的卷积神经网络,具有实际意义。
其他文献
介绍一种新颖的拔管施工技术及"以顶管为主,顶管和拔管相结合"的施工思路.
<正> 最近,我们采用上海光机所生产的(5.2&#215;5.5&#215;10)mm 的钛宝石激光晶体作为再生放大器的激光介质,实现了钛宝石激光再生放大器的运转.获得了1.2mJ 的能量输出.再生
本课题在一定文献综述的基础上分析了高校网络思想政治教育的概念及特点、新时期以微博为载体开展大学生网络思想政治教育的必要性,进一步提出了以微博为载体开展大学生网络
新一轮基础教育课程改革的一个重要目标,就是要改变至今仍普遍存在的学生被动接受、大量反复操练的学习方式,倡导在教师指导下学生自主进行的科学探究式的学习。
随着泛娱乐产业的兴起,以内容资源为核心进行多元化产品开发成为趋势,推动了版权交易市场的发展。其中,网络文学作品凭借自身丰富的题材和大量的粉丝基础,成为企业间竞相改编
哈贝马斯(Juergen Habermas)的相关理论指出,公共领域的本质就是为人们提供自由、公共的话语交流的互动平台,即公共话语空间。网络的普及为实现这种机会均等、平等参与、自由讨论
本文从高斯光束的理论出发,充分考虑到放大介质的克尔非线性效应的影响,引入了一个与之相应的非线性传输矩阵,对低重复率的钛宝石激光放大系统中的再生腔的结构性能进行了分析研
近年来,为了解决市场经济下出现的一系列住房难的问题,南京市住房保障和房产局不断加快各区域的保障性住房建设。保障性住房项目需要建设单位、市房改办处的共同参与,最后由保障对象来选房。由于南京市住房保障事业正处于调整转型、发展迅速的关键时期,保障性住房需求量大,以信息化手段推进住房保障建设中的各项工作显得尤为重要。为了实现南京市保障性住房项目的精细化、标准化管理,同时改善用房对象选房难的问题,本文研究并
多个生物标志物的同时检测,对疾病的预防和早期诊断具有重要作用和意义。电化学发光是指对电极施加电压,使电极上的反应产物之间或与溶液中的某些组分间发生反应而产生的光辐
认识社会主义的本质,是科学共产主义理论的一项主要任务。继马克思主义经典作家之后,各国共产党对此做了艰难的探索。中国共产党在社会主义建设中,克服了苏东各国共产党在认识论