基于FPGA平台的移位卷积神经网络的设计及优化

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:hudongfei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
卷积神经网络(Convolutional Neural Networks,CNN)作为计算机视觉的重要技术之一,在众多领域的应用越来越广泛。但是深度不断增加的卷积神经网络需要大量的计算资源和内存资源,目前往往通过高算力、高并行、高功耗的GPU作为运算平台。然而,随着物联网生态的构建,GPU显然难以满足终端节点低功耗的需求。近年来,基于ASIC、FPGA等低功耗平台的硬件加速技术的研究在不断推进,FPGA作为一款高并行、低成本、可重复编程的低功耗芯片,在网络加速上有着极大优势。为了满足在终端节点部署卷积神经网络的需求,本文基于软硬件协同设计的思想,通过分析卷积神经网络和FPGA平台的计算特点,设计了一种能够独立在终端节点上进行推理的专用网络加速平台。在软件上,为了提高FPGA平台的计算效率,将权重和激活值进行定点量化;在硬件上,为了减少缓存的占用,基于FPGA平台对本文提出的量化网络进行定制化的设计。具体方案如下:1.通过移位量化将卷积神经网络中的乘累加运算替换为移位累加运算,在保持精度的同时,提高了卷积神经网络的计算速率并降低了运算代价。在训练过程中,为了避免造成较大的精度损失,本文采用了分组量化和分步量化的策略。在分组量化中,将权重按照阈值进行分组,利用浮点权重辅助量化;在分步量化中,将权重量化和激活值量化分开,避免了训练过程中得到的局部最小值并非最优情况的发生。2.在硬件加速设计中,本文分为数据通路设计和专用模块设计两部分。在数据通路部分,为减少缓存的占用,主要设计了四个部分,分别为分块卷积设计、数据缓存设计、数据预读设计以及数据传输设计。在专用模块设计及优化部分,对卷积神经网络的主要网络层卷积层、池化层、全连接层进行了定制化模块设计,并对各个模块进行了整合。本文设计的加速方案采用了逐层计算的模式,在Cifar-10数据集上进行了测试和验证。结果表明,本文所设计的加速器在100MHZ的时钟频率下,图片分类速度可达132.23FPS,相对于原网络在ARM CPU上运行,实现了95.85倍加速,功耗2.034W,DSP使用率仅为4.09%,大大节省了片内计算资源。
其他文献
第一部分系统性红斑狼疮患者听力损失荟萃分析目的:对系统性红斑狼疮(SLE)与听力损失(HL)的关系进行系统性回顾分析,归纳其临床特点。方法:根据关键词检索国内外主要数据库,由作者独立提取资料并对研究文献进行质量评估。采用Review Manager 5.3和stata16.0统计软件对听力损失患病率、纯音听阈测试(PTA)结果进行分析,在此基础上归纳听力损失的危险因素。对纳入的研究行漏斗图分析和B
学位
目的研究lncRNA NEAT1和miR-500a-3p对胃癌细胞的增殖、侵袭和凋亡能力的影响,验证lncRNA NEAT1和miR-500a-3p的靶向关系,探讨lncRNA NEAT1在胃癌细胞中的作用及调控机制。方法利用生物信息学网站分析数据库中lncRNA NEAT1和miR-500a在胃癌和正常组织中的表达水平,并且分析lncRNA NEAT1和miR-500a与胃腺癌患者分期的关系。利
学位
超分子化学是包含了物理、化学、生物等的交叉学科,目前正在逐步延伸到新的领域。超分子的结构是运用氢键、非共价键等分子间作用力来调控支配,科学家们精心设计分子单体,又通过自组装方法合成得到有新颖结构和功能的超分子组装体。超分子自组装是目前热门的话题之一,新颖的超分子体特有的结构和功能在客体包结、荧光传感、超分子催化、稀土应用等领域有广阔的应用前景。本文通过设计含氮的有机配体和过渡金属通过自组装得到一系
学位
技术的发展为互动媒体带来了更多可能性,其互动模式及种类变得越来越丰富,与此同时,观众对互动体验的需求也变得更加多元化,虽然目前市面上的互动类应用非常普及,但真正能带给用户优质体验的产品却为数不多。在此现状下,本文从“情境体验”着手,试图将“人-机-环境”与互动媒体相结合,挖掘影响情境体验的相关要素,研究相关应用的展示媒介,继而提出面向情境体验的互动媒体设计流程,并以此为指导,更好的完成面向情境体验
学位
背景:双相情感障碍(bipolar disorder,BD)首发抑郁相易误诊为抑郁症(major depressive disorder,MDD),从而耽误治疗,影响预后,因此对这类患者的早期发现十分重要。昼夜节律紊乱与转躁密切相关,但尚未发现昼夜节律通路基因的基因多态性与转躁的关系,更未有人整合多维度数据进行转躁预测。本研究目的旨在结合临床特征和昼夜节律通路相关基因遗传多态性发现影响MDD转躁的
学位
硝基芳烃化合物(Nitroaromatic Compounds,NACs)是一类重要的环境有机污染物,具有致突变、致癌和致畸等毒性作用。由于资源有限,目前关于它们对人类健康及对环境潜在不利影响的毒性数据存在大量空白。随着近些年计算机技术和人工智能的不断发展,构效关系(Structure Activity Relationship,SAR)已成为评价环境污染物对人体及环境危害的重要手段之一,一方面S
学位
目的:探讨人血清肿瘤坏死因子样弱凋亡诱导因子(TWEAK)水平与寻常型银屑病是否存在相关性。方法:本研究纳入2020年10月到2021年3月就诊于中国人民解放军东部战区总医院皮肤科门诊的寻常型银屑病患者31名,健康对照组25名。比较两组之间基线资料、血清TWEAK水平以及IL-6、IL-17、IL-23水平的差异。根据PSAI评分将患者分为低PASI组(PASI评分<10分)和高PASI组(PAS
学位
目的研究初诊恶性肿瘤患者临床诊疗过程中伴发焦虑抑郁的发病情况、临床特征及相关危险因素,探索恶性肿瘤患者伴发焦虑抑郁早期发现、早期评价、早期诊断的方法,并为该患者群早期干预提供依据,以期为改善恶性肿瘤患者整体康复提供理论依据。方法根据纳入、排除标准,纳入自2019年5月1日至2021年4月1日期间,于东南大学附属中大医院肿瘤科、呼吸科、血液科、普外科住院初诊并行系统抗肿瘤治疗(化疗、放疗、靶向治疗或
学位
学位
在我国资本市场持续完善和优化时,上市公司并购重组活动持续增多。特别是近期,上市公司并购重组数量以及涉及金额不断增加。目前,上市公司并购重组时期存在的问题引发各界关注。在上述问题中,重点是并购时期的大额商誉确认。站在上市企业的角度上,大额商誉的确认有利有弊。首先,也许可以为公司提供更高的经济效益,并购各方实现协同目标;弊端在于,在商誉产生之后,公司也做出一定的业绩承诺或者制定补偿协议,假设没有在要求
学位