面向嵌入式应用的深度学习加速系统设计与实现

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:stanley45518501
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能在物联网领域的高速发展,面向嵌入式应用方向的深度学习技术也在不断革新,利用卷积神经网络的方法研究行人检测便属其中之一。传统的行人检测研究大部分都是在GPU平台上去实现,但基于GPU的研究方法会存在着功耗大、速度慢、成本高等客观缺陷,加上神经网络本身的计算复杂度较高,因此不能够较好地满足嵌入式应用中所需要达到的实时性以及准确性。然而值得庆贺的是,基于FPGA的嵌入式异构平台在深度学习加速系统这一研究领域有着极为出色的表现。本文也将对基于FPGA嵌入式异构平台上的行人检测加速系统加以详细阐述。本文经过对一系列行人检测方法和嵌入式应用平台加以研究后,最终决定在软件上采用YOLOv2网络,硬件上采用Intel A10 SOC FPGA嵌入式异构处理平台来对行人检测加速系统进行设计与实现。在加速设计方法上,本文依据Open CL所具有的异构并行计算特性,主机端负责数据预处理和系统的整体调度,将复杂度较高的计算密集型运算以数据处理内核的方式部署在FPGA端实现,从而将多个数据处理内核连接成一个深度流水线结构,省去了数据处理过程中频繁的读取操作,降低了系统运行时对较高带宽的依赖,提高了系统的执行效率;并通过设置卷积内核在不同维度上的并行度来加速卷积运算,极大地提高了卷积运算的效率,起到了很好的加速效果。本文最终在Intel A10 SOC FPGA嵌入式开发板上设计实现了基于YOLOv2网络的行人检测加速系统。首先对系统硬件平台进行搭建,包含软硬件开发环境配置,编译安装了Linux内核摄像头驱动,实现了摄像头实时行人检测的目标;另外,本文还在Darknet框架下训练了行人检测模型,并进行了训练模型性能评估,模型平均准确率达到了90%以上,可以很好地应用于系统的部署与实现;最后通过在DE5_NET FPGA开发板和A10 SOC FPGA嵌入式平台上的系统性能测试,验证了本文所提出的加速设计方法的可行性。其中,DE5_NET FPGA板卡上,在系统整体逻辑资源仅占25%、RAM资源仅占46%和DSP资源仅占14%的条件下,将YOLOv2行人检测系统加速到了409ms左右;A10 SOC FPGA嵌入式平台上,在资源利用率相近的条件下,将行人检测系统加速到了225ms左右。除此之外,在基于摄像头的实时视频流行人检测实验中,YOLOv2行人检测系统在准确率为93.95%条件下能够达到30帧/s的实时效果。
其他文献
Roper-Suffridge算子的引入,连接了单复变几何函数论与多复变函数论,在由双全纯函数构造双全纯映射的过程中有举足轻重的作用,本文推广了 Roper-Suffridge算子的性质,即给出
钌亚乙烯基配合物具有丰富的反应性质,又易于通过端基炔与过渡金属反应得到,在包含端基炔的催化反应中有着重要应用,因此吸引了人们长期的关注。本论文围绕8-膦基喹啉钌亚乙
固有无序蛋白是一类缺乏稳定构象的蛋白,在人体的众多的生理过程中发挥重要的功能。固有无序蛋白不能用固定的构象来描述,而必须用很多不同构象组成的结构系综来表示。目前,
高超声速飞行器存在巨大的军事价值和经济价值,逐渐成为各国科技竞争的焦点。由于其飞行速度及近空间飞行环境的影响,高超声速飞行器受内外部扰动,气动参数变化剧烈,结构存在
镍(Ⅱ)去甲咔咯因其具有可逆的氧化还原性质、独特的反应性以及在充电电池、电化学传感器、电学活性材料的潜在应用,不少的科研人员对其进行研究。本论文围绕的是镍(Ⅱ)去甲
高铬耐热钢在实际服役中会发生蠕变性能退化,此退化与析出物的演化密切相关,因此析出强化是耐热钢的强化手段之一。本文基于析出相M23C6的元素组成,探究W、B两种元素对析出物
随着我国对用药安全关注的日渐增强,药品监管工作面临的挑战也逐渐增多。为提高监管工作效率,药品监管部门将信息化技术引入到监管工作当中,衍生出信息化监管系统。随着时代的变迁,药品监管部门的信息化系统开始从独立运行向梯级联合转变,对高灵活度、高易用性、高运行效率特性的需求也将逐渐增强。本文研发的药品管理信息系统以提升药品监管工作效率为主要目的,强化信息的搜集与利用功能,整合数字图像处理、文字识别、移动应
超密集网络(Ultra-Dense Network,UDN)通过密集部署大量小功率微型基站形成密集小小区,可以实现无线蜂窝网络的无缝覆盖,提高网络的吞吐量,提升用户的服务质量,降低用户终端到网络的传输时延。UDN已经成为第五代移动通信系统的一种关键技术。然而,UDN也存在一些技术挑战。小小区数量急剧增加且与宏蜂窝小区在空间上重叠部署,这使得网络拓扑结构变的十分复杂,基站的资源管理越来越困难,网络能
电磁诱导透明(EIT)是一种量子干涉效应,为量子传感开辟了新的路径。通过外加控制场与介质发生相互作用,介质在一定频率范围内对探测场的吸收发生变化,透过率增加甚至完全透明,并且该透明窗口处的极化率发生了陡峭变化,介质由原来的正常色散变成反常色散。利用EIT效应可以实现慢光效应、光存储、光开光、单光子源制备以及微波电场测量。近几年来,基于里德堡原子的微波电场测量引起了研究者的极大兴趣。里德堡原子是处于
随着无人机技术的发展,以无人机拍照的方式进行输电线路巡检正在电网中得到普及和运用。面对无人机巡检获得的海量图片数据,由人工进行缺陷排查存在效率较低的问题,因此利用计算机视觉技术对航拍图像中的输电线路进行缺陷检测成为热点研究问题。本文以绝缘子自爆缺陷检测作为研究对象,将问题转化为对航拍图的图片块的细粒度分类任务。通过对绝缘子航拍图中绝缘子特征的分析,提出基于深度学习的自爆缺陷检测模型。文章的主要工作