基于FPGA的深度学习软硬件协同设计的仿真实现

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:helen_fu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度学习网络复杂度随着研究进展日益增加,作为深度学习的重要分支,卷积神经网数据量与计算量也与日俱增,各种加速平台应运而生。为使得卷积神经网络能够应用在低功耗、高并行度的嵌入式场景,本文致力于研究实现一种基于FPGA的深度学习软硬件协同设计的方法,并基于此实现了YOLOV3-Tiny算法。在对YOLOV3-Tiny网络结构研究后,本文对卷积核参数进行了融入BN层与16bit定点量化操作。本文根据软硬件各自的优势,进行了人工软硬件任务划分,让软件端负责系统控制与适合CPU串行处理的任务,让硬件端负责计算密集型、并行度高的任务。针对PL端任务,本文使用了Vivado HLS高层次综合工具,实现了PL端的加速模块IP核设计与封装,并优化了特征图与卷积核参数的存储方式,使用了多通道传输与乒乓缓冲进一步减少了系统时延;针对PS端任务,本文在Vivado SDK环境下编写了相应的软件驱动,分别实现了图片输入、数据控制与检测输出模块。最终本文基于ZYNQ7035搭建了软硬件协同目标检测系统,该系统在coco测试集下系统性能达到了27.52GOPS,是CPU(Interi5-9300H)的33倍,是ARM(Cortex A9)的707倍,是GPU(GTX 1660 Ti)的0.16倍。性能功耗比达到了12.8GOPS/W,达到了CPU(Interi5-9300H)的58倍,ARM(Cortex A9)的984倍,GPU(GTX 1660 Ti)的25倍,达到了低功耗高性能的目的。
其他文献
期刊
<正>一世界屋脊上的关帝庙拉萨市中心,距布达拉宫约九百米,有小山,名"帕玛日",因形似磨盘,又名磨盘山。西藏最重要的关帝庙便坐落于此。庙坐北朝南,主殿是典型汉式石木建筑,抬梁式架构,单檐歇山顶(2007年
期刊
随着技术的不断进步,大数据正在更多的领域中发挥着日益巨大的功能。目前大数据开始慢慢融入到审计业务当中,海外许多大型企业例如高盛等公司都全面开始采用审计大数据,许多企业在经历第一轮试水以后也已经开始争相应用,大数据技术正不断地在审计业界传播起来。文章中通过对问题背景说明,首先阐述了大数据技术的重要性。之后又对国外有关会计大数据的有关理论进行了说明。文中借助案例分析法,对具体的企业进行研究,讨论会计大
本文分析了陆域指挥信息系统国产化软件平台的建设需求,面向服务器、指控端、机载终端、火控终端、手持终端等异构环境,开展了可支撑跨平台软件开发/运行/集成、多种场景作战运用的国产化指挥信息系统软件平台设计,提出多模态自适应人机交互、跨平台服务开发集成、异构硬件平台适配优化、软件运行库和跨平台中间件集成优化等关键技术解决方案,为陆域指挥信息系统的异构软件集成部署、跨平台协同运行、多场景适配运用提供了基础
<正>每年的假期,父亲都会带着我们全家到外地旅行。在2021年讨论暑假旅行的家庭会议上,我提议进行一次大河人文之旅,这样不仅可以沿途观赏到沿途山川的壮丽景色,品尝沿途各地的特色美食,还可以通过实地考察将学习过的语文、地理和历史知识贯通起来。我的提议得到了全家人的一致同意,而且我们决定选择黄河作为此次大河人文之旅的对象。黄河是中华民族的母亲河,她孕育了几千年的中华文明。不管是文学、地理,还是历史,与
期刊
“忠实”一直以模糊、多义且演化的样态主导着翻译实践与研究。《西游记》英译者余国藩关于翻译的思与行之道,为我们研究忠实翻译问题提供了一定的思路。余国藩秉持认同差异、兼顾读者、面向原文整体的忠实观。这一观念使他奉行异于其他译者的求真务实原则:在意义层面,求原文寓意之真,务原旨可读之实;在审美层面,求诗学形式之真,务韵美可读之实;在风格层面,求乡土风格之真,务风情可读之实。这番思与行的关联分析揭示了翻译
为验证伪狂犬病病毒(pseudorabies virus, PRV)US3基因缺失后作为疫苗的免疫效力,构建PRV△gE/TK/US3基因缺失株。利用PRV QYY2012变异株基因组扩增US3基因两侧序列作为同源重组的左右侧同源臂,以绿色荧光蛋白(EGFP)为标记基因,经酶切依次连接至pBluescript SK(-),构建重组转移载体pSK-US3-LR-EGFP。将pSK-US3-LR-EG
交通标志识别是目标检测领域的一个热点和难点。自然场景下的道路环境复杂多样,交通标志牌在环境中的占比非常小,自身的有效特征会被背景环境中诸如广告牌、树枝等物体遮挡和稀释,导致识别难度增大。交通标志识别用于自动驾驶、辅助驾驶等车载场景时,其识别速度越快,越能及时发现重要交通标志并反馈给驾驶员,这对交通标志识别的边缘部署能力和处理速度提出了要求。而现有的交通标志识别方法中,很难兼顾在嵌入式场景下对小目标
在全球化背景下,企业自身经营压力和环境竞争压力越来越大。而最终的胜败取决于企业管理水平的高低,财务指标分析作为企业管理一项重要内容对于企业未来的可持续性发展,从容面对未来的风险挑战就显得愈加重要。然而,实际工作中,受各种因素影响,财务分析并未发挥其应有的作用。文章通过分析企业财务分析对企业经营决策的重要性,以及在实际工作中财务分析存在的问题并提出了一些解决的措施,旨在为企业发挥财务分析的作用提供借
随着计算机科学研究的迅速发展、农业机器人技术的提高,田间人工劳作的方式渐渐被智能化机器人代替。农业自动化系统成为当前国内外农业创新研究的重要组成部分之一。导航系统是农业机器人在田间进行自动化作业的前提,这对于智慧农业来说至关重要。本文根据田间垄线的结构特征,提出一种基于垄线结构提取的导航算法,且将此算法部署到FPGA(Field Programmable Gate Array)上,以改善系统算法的