基于FPGA的目标检测算法加速与实现

来源 :北京交通大学 | 被引量 : 22次 | 上传用户:kuang25748
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测算法在国防安全、交通运输监测和医疗研究等领域都有着非常广泛的应用前景。基于深度学习的目标检测算法是对目标物体提取特征然后进行分类,最后将目标物体显示出来,整个网络通常包含数百万个神经单元和数百万个连接单元,其计算量非常大,这就使得目标检测网络很难应用在小尺寸和低功耗的移动平台上。目前主流的GPU嵌入式平台能量效率太低,很难实现目标检测算法的实时性检测功能。FPGA则提供了大量的设计资源,采用并行化计算的思想加速目标检测算法,使其能够在小尺寸、低功耗的嵌入式平台上应用。本文的主要目的就是实现目标检测算法在FPGA平台上的加速。本文通过对目标检测算法的全面分析,最终选择YOLOv2网络作为本次在FPGA开发板上加速的对象。根据YOLOv2算法的运算结构设计了一种基于Open Computing Language(OpenCL)框架的FPGA加速器,FPGA加速器中通过卷积内核、池化内核和Batch Normalization(BN)内核分别对YOLOv2网络中的卷积层、池化层和BN算法进行并行化加速计算。这种并行化计算方式将大幅度减少计算资源和内存带宽,还可以提高计算吞吐量。FPGA加速器中的各个内核采用流水式计算架构,能够实现大规模的网络加速。本文还采用了将32位浮点数量化成8位定点数的方法,减少了 FPGA加速器的内存存储空间以及数据传送量,同时节省了 DSP的计算资源。本文最后将编写好的YOLOv2网络的OpenCL代码移植到DE5-Net开发板上运行,进行目标检测算法的加速实验。最后验证了在FPGA平台上对目标检测方法加速的可行性,本实验在功耗仅为27w的前提下,将YOLOv2目标检测的运行时间加快到450ms左右。除了在FPGA平台上实现了 YOLOv2网络的加速以外,本文还实现了一种在安防检测方面的应用。利用Darknet深度学习网络和YOLOv2网络对刀、枪和棍模型进行训练。本文在PASCAL VOC 2007数据集的基础上新建立了 一个有关刀枪棍的数据集,通过训练得到能够识别刀枪棍物体的权重值,最终在DE5-Net开发板上实现对刀枪棍危险物品检测的应用。
其他文献
2011年12月2日,琉璃弦音-当代玻璃艺术展在四川美术学院开幕。这次展览作为四川美术学院第一个琉璃艺术展受到学院领导的高度重视,设计艺术学院院长郝大鹏为支持学科发展亲自为
筛选对临床分离多重耐药猪大肠杆菌有抑菌、杀菌作用的中药,并分析部分中药的联合抑菌效果。选用标准菌株ATCC83707作为对照菌株,采用纸片法测定分离菌株对临床常用抗生素的
为了对商品肉鸡梭菌性肠炎的发病情况进行调查,本试验对收集的不同养殖模式的具有肠炎症状的肉鸡肠道内容物进行了产气荚膜梭菌的分离鉴定、活菌计数、菌株毒素类型鉴定以及
现浇桥梁上部结构跨径大、梁体高、自重大、行车较舒适,但所需架材多,对地基承载力和支架的强度、刚度、稳定性要求较高,传统的支架布设方法不能满足要求。文中针对现浇桥梁
为了建立氟尼辛葡甲胺掩味口腔崩解片的质量标准,采用薄层色谱法(TLC)鉴别氟尼辛葡甲胺掩味口腔崩解片中的氟尼辛葡甲胺,采用高效液相色谱法(HPLC)测定该制剂中氟尼辛葡甲胺
根据《中华人民共和国产品质量法》和《产品质量监督抽查管理办法》的规定,2017年,中华人民共和国国家质量监督检验检疫总局组织对共享自行车产品开展了产品质量国家监督专项
以啤酒酵母蛋白为底物,以中性蛋白酶的酶解效果为衡量指标,采用对比分析和多元线性回归正交组合设计试验方法,优化出中性蛋白酶可控酶解啤酒酵母蛋白的工程化回归模型。优选出最
<正>中央农村工作会议和"一号文件"都提出,要把产业链、价值链等现代产业组织方式引入农业,促进一、二、三产业融合互动,大力发展"第六产业"。所谓"第六产业",是由日本东京大
东岳桥是一座等截面悬链线双曲拱桥,通过检测发现该桥的病害状况并进行安全性评定,采用拱肋下缘增加钢筋砼拱板、将肋拱变为封闭箱拱的方法加固改造该桥,提高桥梁承载能力和