基于FPGA的深度学习加速器设计与实现

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:xiejie_850119
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着计算能力的剧增和学科技术相互渗透、不断发展,机器学习渐渐被大众所认知和接受,并逐渐出现在大众生活中。无论是逛淘宝时物品推荐,汽车无人驾驶,还是轰动一时的人机围棋大战AlphaGo,机器学习让人们感叹科技力量的同时也改善了人们的日常生活。深度学习作为机器学习的新兴领域,起源对人工神经网络的进一步研究,为生物科学和计算机科学相互交叉渗透的产物,其在处理复杂抽象的学习问题上有着出色表现,也因此迅速在学术界和商业界风靡。然而,为了解决更加抽象、更加复杂的学习问题,深度学习的网络规模在不断增加,计算和数据的复杂也随之剧增,比如Google Cat系统网络具有10亿左右个神经元连接。如何高性能低能耗地实现深度学习相关算法,则成为科研机构的研究热点。现场可编程门阵列FPGA作为常用的加速手段之一,具有高性能、低功耗、可编程等特点。本文采用FPGA设计针对深度学习通用计算部分的加速器,主要工作有:1)、分析深度神经网络、卷积神经网络的预测过程和训练过程算法共性和特性,并以此为基础设计FPGA运算单元,算法包括前向计算算法、本地预训练算法和全局训练算法。2)、根据FPGA资源情况设计基本运算单元,包括前向计算单元和权值更新运算单元。运算单元均进行可配置和流水线设计,在适应不同规模深度学习神经网络的同时具有高吞吐率。3)、分析FPGA加速器的上层框架和数据通路,编写linux操作系统下驱动程序以及面向上层用户简单易用的调用接口。4)、通过大量实验测试分析影响加速器性能的各种因素,得到加速器的性能、能耗趋势,使用测试数据集与CPU、GPU平台进行性能、功率、能耗等参数对比,分析FPGA实现的优劣性。
其他文献
4K数字摄像机是4K超高清电视节目制作中不可或缺的拍摄设备。本文对国内外4K数字电视的发展现状进行梳理和分析,汇总了市场上几款流行的4K数字摄像机的传感器、有效像素、分
利用i OS系统开发一款O2O服装购物软件,以i OS为搭建平台,集同城服装购物、社区交际于一体.集合所在地区的实体服装店,实现线上浏览线下购买相结合的经营模式,并利用i OS系统
随着城市的不断飞速发展,建筑行业也随之壮大起来,而人们生活水平的不断提高,对于建筑物的功能、性质以及环保状况提出了更高的要求。近年来基于环境被破坏严重,保护环境开始
煤矿动载扰动易诱发巷道冲击破坏,为研究动载对煤层巷道冲击矿压的影响,运用FLAC2D中的动态模块,研究分析了不同动载强度下震动波在巷道顶板传播的速度、位移变化规律及震动
近代女子教育观念的更新经历了从“贤妻良母”到“女国民”再到“男女平等”的三个递进阶段 ,完成了由“女性”的性别教育到“人”的教育观念的转变。但女子教育观念的更新 ,
随着科学技术水平的不断提高,三维重建技术在工业、军事以及医学等领域得到了广泛应用,主要应用范围包括三维模型获取、虚拟仿真、非接触式测量、科学计算、增强现实、战场环
伴随着互联网技术的迅猛发展,消费者的消费观逐渐成熟,到网上进行购物慢慢地成为千家万户购买的重要选择。淘宝网店品牌形象设计加强了网店的视觉形象,满足消费者的视觉需求,
通过分析湿式离合器的接合过程,应用一维平均雷诺方程和粗糙表面弹性接触模型建立湿式离合器接合过程数学模型。利用龙格-库塔数值方法对接合过程数学模型进行求解,研究湿式
随着社会经济的发展,医疗卫生体制改革的深入,对提高医院的管理水平,提高医院的工作效率,调动医务人员积极性,增强医院的综合竞争力提出了更高的要求,已成为我国医院管理工作