基于FPGA的YOLOv2网络研究与实现

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:jianjia88521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测是计算机视觉基本任务之一,随着深度学习时代的到来,基于卷积神经网络的目标检测算法得到长足的发展,然而算法的产品化落地问题还亟待解决。YOLOv2检测网络作为一个性能优良且能达到实时性要求的目标检测算法,具有结构简单,网络层数相对较少的优点,是将目标检测算法进行产业化落地的一个很好的选择。FPGA的并行计算、可重构性与低功率使得其是将基于卷积神经网络的目标检测算法移植到嵌入式系统一个很好的平台方案。首先,为了在FPGA平台上能更高效部署YOLOv2检测网络,本文对YOLOv2检测网络的存储空间以及计算方式利用增量网络量化的方法进行优化,将单精度浮点数格式的权值量化成2的整次幂,利用4位位宽对其进行编码,使得YOLOv2检测网络模型大小减少了近8倍,同时,卷积层中的浮点数乘法可以转化成定点数的移位操作,并且量化后的YOLOv2网络在Pascal VOC2007数据集上的检测性能与量化前的性能保持一致。其次,考虑到YOLOv2检测网络是在卷积神经网络的基础上提出的,为了我们的设计适用于其他的基于卷积神经网络的目标检测算法,本文分析了并且在FPGA上实现卷积神经网络通用的模块,通过对各模块的功能仿真,验证了我们设计方案的正确性。最后,受限于FPGA平台的计算资源以及内存带宽,基于FPGA的YOLOv2检测网络在前向推断的计算过程中需要对每一层进行分块计算,为了充分利用FPGA平台的计算资源以及内存带宽,本文利用Roofline Model挑选最佳分块参数。另外,为了减少对外部存储的访问次数和推断时间,本文使用了双缓冲机制并且在不同的层之间引入了流水线操作。实验结果表明,在Zynq7000系列,芯片型号为xc7z035ffg676-2的开发板上,工作频率为100 MHz情况下,本文提出的基于FPGA的YOLOv2检测网络能达到3.2帧每秒。
其他文献
试验制备了猪支气管败血波氏杆菌微量凝集反应用诊断抗原,对延边州内某猪场的64份血清进行了猪传染性萎缩性鼻炎的微量凝集反应,检出阳性血清26份(40.63%).应用甲醛灭活的免
基于发光材料的多功能纳米复合材料是在发光材料的基础上附加其他功能的材料,并有望在生化、环保、催化等方面得以更多的应用。稀土发光材料由于其独特的发光特点和良好的物化性质而受到广泛的关注,不同的基质与掺杂离子还能带来发光的增强与性能的改善。贵金属材料由于其固有的表面等离子体共振和能量共振转移效应,可以有效地实现光能与热能的转换。本论文通过简单高效的方法将稀土发光材料与贵金属材料结合为一体,构筑具有优化
荧光蛋白是现代生物学研究中的重要标记工具之一。科学家们基于已有发色团结构及荧光蛋白发光机理,已经获得了许多光学性质优良的荧光蛋白。就深层组织成像而言,所使用的荧光
心肌细胞膜上存在着两种不同电流特性的钙通道:L型、T型。与T型钙通道相比,L型钙通道具有大电导、高电压激活、长时间开放,能和多种拮抗剂作用的特点。L型电压依赖性钙通道(L-VDC
以安徽科技学院城乡规划专业为例,以职业资格标准为导向,完善专业课程体系,改革专业教学内容,优化师资队伍结构,提升教师能力水平,强化实践教学,完善实践培养体系,为规划设计
8月22日至24日,湖北省住建厅举办了灾后重建村镇建筑工匠培训班,要求各地严格执行抗震要求,规范房屋设计,加强施工质量监督检查,探索建立农村建筑工匠资格制度。2016年入梅以
从城市生活垃圾转运方式入手,阐述了城市垃圾全密封压缩式转运的必要性和重要性,指出城市垃圾转运发展趋势为全密封压缩式转运;最后对全密封压缩式转运改进方向予以探讨。
水稻作为我国重要农作物,其营养生长和生殖发育过程都受到严格的生物钟的控制,因此,生物钟基因的表达变化也是决定水稻产量和种子质量的主要决定因素之一。为了更全面系统的
东江是珠江的第三大一级支流,为广东省重要饮用水源和重点水质保护区.东江源头位于江西省寻乌县桠髻钵山.东江源不仅担负香港、深圳、惠州、东莞、河源等地的供水,而且担负下
羊肉作为一种高蛋白、低脂肪、富含营养物质且绿色生态的优质畜产品,近年来日益受到消费者的青睐,2001-2016年,我国羊肉消费总量从107.8万吨上升到207.6万吨,增长了92.6%,且增长势
报纸