基于FPGA的YOLOv3模型优化与实现

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:swgjtd44qx0
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能技术的革新以及硬件水平的提升,目标检测技术在近几年有了突飞猛进的发展,基于深度学习的检测算法层出不穷,逐渐应用于生活的各个方面。但是目前常用的目标检测算法几乎都具有很高计算复杂度,需要依靠高性能计算机的帮助才能完成任务。然而目标检测的许多应用场景,比如无人驾驶、导航制导、交通监督,都需要将算法部署在移动端设备上运行,而移动端设备往往并不具备高性能的计算能力,导致目前效果较好的深度学习目标检测算法很难部署在移动端设备上。本文的研究课题就是针对FPGA的运算特点和YOLOv3目标检测算法的优缺点进行针对性的算法优化和硬件实现,填补移动端目标检测算法的空缺,主要研究内容及成果如下:1.针对卷积运算的特点,利用FPGA的并行计算优势,在FPGA中设计卷积乘法阵列,统一输入输出数据位宽,同时调用2000余个DSP单元进行乘法计算,实现高度并行化计算,运算速度是单一卷积运算的256倍。2.针对卷积运算数据调用次数太多的问题,使用三行移位寄存器首尾连接进行数据缓存,使得每一个像素点只需要读取一次即可完成该点的所有卷积运算,该设计方法使得像素点读取次数仅为原本像素点读取次数的九分之一。3.针对目标检测算法缓存数据过多的问题,使用高性能计算机计算时可以利用高达16G的内存资源缓存所有运算数据,但是FPGA不具备这样的内存资源,所以本文设计了特殊的RAM交互方案,仅用180Mbit的RAM资源即可完成整个算法的运行并输出检测结果。4.YOLOv3算法包含特征提取部分和三尺度检测部分,本文合理采用流水线设计方法,有效地提高了算法运算速度,使得运算时间缩短为原始运算时间的一半。5.针对设计的FPGA算法架构,提出了算法优化策略,首先在训练YOLOv3算法模型时对BN层参数添加正则化约束,使得更多的BN层参数朝着0的方向变化,在对精度影响较低的情况下实现了网络的裁剪;其次,为节省模型参数量,对模型参数进行有限比特量化,在牺牲少许准确度的前提下尽可能减少模型参数;最后借鉴已有的网络裁剪方法,提出了一种符合本文硬件设计的新型网络裁剪方法。
其他文献
传统民族服饰记载和传承着一个民族的文化内涵、宗教信仰、风俗习惯等。例如,传统民族服饰中的“龙”,在明清代表了“权势、高贵”,是君权的象征;“蝴蝶”则代表了幸福与爱情。随着时代的进步,传统民族服饰渐渐退出时尚的舞台,其代表的文化内涵也被淡化。为了更好的解读、保护和传承中华民族的传统文化,研究传统民族服饰的多标签标注成为了必然。本论文以传统民族服饰图像为研究对象,针对传统民族服饰图像区别于自然图像的特
可重构机器人是由一些同构模块或者异构模块装配而成,能够根据工作环境和工作任务重新组合成新的构型。目前,可重构机器人需要获得精确的动力学参数方能进行高速高精度动力学控制。但可重构机器人是一个复杂的、多变量、强耦合的非线性系统,很难直接获得精确的动力学参数。因此,需要对可重构机器人进行动力学参数辨识研究。本文的主要研究内容如下:(1)对可重构机器人的动力学参数辨识进行了总体设计,将参数辨识分解为几个关
随着全国经济的不断发展,人们生活水平在不断提高的同时,也面临着快节奏生活带来的负面影响,人们对精神文化的需求程度不断加深。中华民族是崇尚文化重视文化的民族,李克强总理也曾多次提到“全民阅读”这一关键词,如何在繁杂的日常工作与生活中满足人们对阅读以及精神文化的需求成为商家们的重要突破点,各种文化产品不断出现,其中,普及程度最高的当属微信公众号。经典文化类微信公众号利用碎片化阅读的优势为人们提供多种类
多载波调制技术有着频谱利用率高、抗多径衰落能力强的优势,在无线通信领域有着广泛的应用。其中正交频分复用(Orthogonal Frequency Division Multiple,OFDM)技术在第四代(4th Generation,4G)移动通信技术时代大放异彩,在第五代(5th Generation,5G)移动通信技术时代也占据重要地位,而滤波器组多载波(Filter Bank Multi-
本文运用布迪厄的符号权力理论框架,采取个案研究策略,对W村黄氏的族谱文本及修纂活动进行考察,并围绕如下问题着重探讨:第一,在修订和日常实践过程中,族谱是如何在变化着的环境中重构自身的权威进而发展出符号权力?第二,作为符号权力的族谱又是如何在宗族内实现社会秩序的再生产?研究认为,续修族谱过程中发生在个体与编委会之间的矛盾冲突,实质上反映了时代转型过程中所面临的社会解组问题。每一个故事的背后都说明着一
随着互联网的飞速发展以及互联网金融技术的不断进步,人们的消费模式发生了巨大变化。作为互联网金融的重要组成部分,支付业务通过手机、电脑等媒介在金融机构的参与下实现商家和消费者之间的交易。第三方支付的迅速发展使得支付过程中可能存在的违约风险、资金流动性风险等问题更加受到重视。在上述背景下,本文以上海富友金融网络技术公司为研究对象,首先对第三方支付公司业务风险评价与控制的现有理论及文献进行梳理和总结,探
当前,中国经济进入了快速发展时期,跨国公司的数量不断增加,进一步推动了经济快速发展。良好的国内经济形势也带动了海外公司的快速发展,提高了跨国公司的市场占有率,使得跨
目前,经济社会的快速发展,使得生态环境破坏严重,生态系统失去了平衡,针对生态环境问题,我们国家提出了生态红线的概念,目的是在生态服务功能重要区和生态敏感区/脆弱区建立生态保护,维护国家生态安全,实现社会的可持续发展战略。本文以祁连县为研究区域,基于生态红线划定的技术理论,借助Arcgis平台,完成生态红线的划定工作。本文的主要研究内容和成果如下:(1)结合祁连县的区位特征,从地形、气象、土壤、地表
中国经济正处在由高速增长阶段转向高质量发展阶段的重要时期,技术创新是转变经济发展方式的关键所在,同时也是提升经济发展质量与效益的基础。在影响技术创新的诸多因素中,房地产发展是其中不可忽视的一个重要因素。自1998年中国全面推行住房商业化以来,房地产行业进入飞速发展阶段,房价整体一路高涨。房价的上涨一方面带动相关产业发展,加快国民经济发展步伐,另一方面却持续吸引着资金、劳动力和土地要素纷纷投向房地产
低光照图像是指在低光环境中采集的图像。例如,夜晚街道上的监控系统捕获到的图像,在地下煤矿开采时工人为了勘察用拍照设备获取的图像。低光照图像具有较低的信噪比且会损失纹理细节,所以对其处理与分析一直以来都是一个具有挑战性的任务。对低光照图像进行增强,使其转换为正常亮度的图像,有利于其下游的图像处理任务,比如:目标检测、物体跟踪,图像分类等。现有的运用深度学习对低光照图像增强的方法主要是针对普通低光场景