基于ZYNQ嵌入式平台的CNN图像识别加速器研究与实现

来源 :中国科学院大学(中国科学院沈阳计算技术研究所 | 被引量 : 0次 | 上传用户:shashh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
卷积神经网络(Convolutional Neural Networks,CNN)是当前深度学习领域重要研究热点之一,因其具有平移不变性和权值共享结构的特点引起了研究者的广泛关注。目前,CNN在目标检测、图像识别、语音处理等研究方向取得了重大突破,研究成果已被不断地应用于工业生产、生活服务等各个场景中。如何将CNN引入到计算资源和存储资源受限的嵌入式平台中,发挥其在可便携、低功耗的嵌入式平台中图像识别的优势,以实现更快的识别速度,已成为深度学习领域未来发展和进步的主要趋势。然而,随着在嵌入式环境中图像识别准确率需求的不断增加,对应CNN的网络层数在不断增多,其计算复杂度也在逐渐升高。这些问题给CNN在资源有限的嵌入式平台应用带来了困难。针对上述问题,本文开展了基于ZYNQ嵌入式平台的CNN图像识别加速器研究,其贡献与创新点如下:1)针对卷积运算效率低、空间资源占用大的问题,本文提出了一种基于GOWN的加速方案,该方案能够根据卷积核的大小选择不同的加速算法。GOWN加速方案通过使用矩阵分块与内存对齐策略等方法完成对Darknet框架中原有Gemm算法的改进,实现了空间资源占用的减少。同时该方案通过Winograd算法进一步优化数据打包策略,并使用Neon指令集加速了其算法中的矩阵运算,最终替换Gemm算法,实现了减少计算资源的同时提高了计算速度。通过实验测试,基于GOWN的加速方案能够在提高Top-5分类正确率的情况下,缩短5-12倍的图像识别分类时间。2)针对CNN中计算资源耗费较多的问题,本文提出了一种基于ZYNQ的硬件加速方法,该方法能够减少卷积计算量的同时提高加速性能。该方法采用了特征图展开、卷积核复用、乘累加并行、FSM_Timer访存等方法,分别实现了卷积层电路设计、池化层电路设计、全连接层电路设计。另外,本文根据数据输出的稀疏度,通过使用SLICEL逻辑中LUT资源完成对预先计算的卷积结果做直接映射的策略,实现了CNN图像识别中卷积计算量的减少。实验结果表明,硬件化后的CNN在图像识别与分类的任务中计算效率更高且消耗的功耗更低。3)为了能够将加速器应用到实际场景中,本文构建了一种基于ZYNQ的CNN图像识别加速器样机,该样机具有图像采集、图像处理和图像显示的功能。为了方便功能的扩展,本文在ARM中移植了Debian操作系统。为了观察图像采集的效果,本文基于QT工具实现了显示界面的设计,并通过捕获按钮实现了一帧图像的保存。通过试验可以得出,该加速器样机采集的图像可以在显示器中正常显示,并且可以提供给CNN进行处理。该加速器样机能够在提高Top-5分类正确率的情况下缩短图像识别分类所需的时间,并且计算效率更高、消耗的功耗更低。本文最终在ZYNQ-7020平台上开展了CNN图像识别加速器的软件加速算法的试验验证和硬件加速方法的仿真验证。分别从图像识别与分类准确率、图像识别与分类速度、加速器能耗比、加速器资源占用比率等四个方面对该加速器进行综合评估。实验结果表明,本文提出的基于ZYNQ嵌入平台的CNN图像识别加速器在资源有限的情况下针对Alex Net网络进行加速,Top-5分类正确率提高了近8%,同时识别速度提升了5.54倍。针对VGG16网络进行加速,Top-5分类正确率提高了近5.2%,同时识别与分类速度提升了12.24倍。针对Le Net-5网络进行加速,识别一张图像仅需89.59us,平均计算性能为11.92GOPS,消耗的功率为2.16W,能效比为5.5 GOPS/W。与其它加速器相比,本文实现的加速器表现出较优性能。并且该加速器具有较好的通用性,能够为多种嵌入式智能终端设备提供CNN图像识别加速性能,为嵌入式设备的CNN图像识别提供了重要的参考。
其他文献
牛磺酸(Taurine)是机体内分布广泛且具有众多生理功能的含硫氨基酸,近年来牛磺酸对慢性炎症性疾病具有潜在的防治功能已得到广泛认可。巨噬细胞是参与慢性炎症的重要免疫细胞,其牛磺酸含量细胞内比细胞外高出约100倍。大量研究集中在补充牛磺酸可明显改善"无菌性炎症"疾病引起的巨噬细胞聚集和炎症反应。该文就牛磺酸体内水平及其变化、摄入安全性以及对巨噬细胞免疫功能的调节等方面的研究进行了综述,以期为牛磺酸
目的:比较分支动脉粥样硬化病(BAD)与大动脉粥样硬化型(LAA)和小血管闭塞型(SAO)脑梗死的临床特征和预后的差异,探讨三者预后的情况。方法:选取2014年9月至2016年11月在武汉大学中南医院神经内科住院的358例急性脑梗死患者为研究对象,分别入选BAD、LAA和SAO组。收集患者的基线临床资料、实验室检查及影像学特征;mRS评分评估6个月预后。比较BAD与LAA、SAO患者的临床资料,观
促进中小学生非认知能力的发展是满足新时代人才培养需求的重要工作。基于中国江苏省2020年基础教育学生学业质量监测数据,利用多元线性回归及泛精确匹配法分析后发现,家务劳动习惯的培养是一种投入小、边际效益高的家庭教育,经常做家务劳动有助于学生在大五人格五个维度上的全面发展,对未来青少年成长过程中的身心健康和价值观的培养等方面均有着重大的意义。建议要充分发挥劳动教育在促进学生非认知能力发展过程中的重要作
培育踔厉奋发、笃行不怠的新时代青年奋斗精神,对实现中华民族伟大复兴的“中国梦”具有重大而深远的意义。红色文化的理论品格、历史缘起和实践经验,为新时代青年答好“为谁奋斗”“为何奋斗”以及“如何奋斗”的时代命题提供了重要启示。以红色文化涵育新时代青年的奋斗精神,要从教育引领、实践养成和保障机制上着手。
随着人们审美的变化、社会的进步和经济的发展,视觉传达设计已经不再仅仅局限在平面设计这单一的概念中,正朝着丰富且多元的方向发展,逐渐地向三维立体设计方向发展,所以以Cinema 4D为代表的的三维软件与视觉传达设计的结合越来越紧密,这为现代设计的视觉审美融入了新的生命力。
随着“双碳”目标的提出,由此产生的政策约束和产业变迁对金融业的影响成为大家关注的热点。“双碳”目标的提出带来巨大的绿色投资需求,为绿色金融的发展带来了新动力。但在此背景下,绿色金融的发展还面临着诸如战略转型时间紧迫、金融工具创新不足和商业银行信贷质量管控压力等挑战。金融是现代经济的血脉,产业发展离不开金融的资源调配支持,因此,大力发展绿色金融能够保证“双碳”目标的顺利实现。另外,关注碳交易市场、创
乡村公共文化建设无疑是实现乡村振兴的重要支撑点。近年来,广安市在乡村公共文化建设方面做了有益的探索,也取得了较好的成效,但是依然存在一些短板,如公共服务投入不足,管理不够规范;村民供需服务不匹配;乡村文化人才匮乏;乡村文化活动缺乏创新,不良风气肆意滋长等。在推进乡村公共文化建设工作中,相关各方面应努力探索,力争做到“对症下药”。
跆拳道运动项目受到广大青少年的青睐,许多青少年都喜欢着爱闲暇之余学习跆拳道。兴趣才是青少年学习萌芽的开始,课堂教学内容安排的合理性,就是训练教学是否可以持久的影响因素之一。因此,本文首先说明跆拳道教学的主要内容,再通过完善跆拳道训练教学的体系、学习跆拳道运动项目的精神、根据青少年身体发展特点选择教学内容、教学过程中降低受伤的概率以及加强跆拳道智能训练等方面,对青少年跆拳道教学的措施进行阐述。
采用小型环境舱模拟聚氯乙烯(PVC)卷材地板在实际使用过程中挥发性有机化合物(VOC)的释放过程,利用热解析-气相色谱质谱联用(TD-GC-MS)法测定总挥发性有机化合物(TVOC)释放量.各组分检出限为0.2—0.4μg·m-3(S/N=3),定量限为0.6—1.4μg·m-3(S/N=10).对20个PVC卷材地板的TVOC释放规律和主要污染物来源进行了分析.
中原姓氏入闽迁台作为中国移民史上一个独立的移民事件,其研究源自20世纪80年代初闽籍学者在闽方言及民俗学调查时的新发现,因其回应了台湾同胞回归祖国的期盼,而成为新发现的新学问。把中原姓氏入闽迁台史、中原入闽迁台姓氏及其后裔的家族记忆,以及家族记忆在两岸的当代认同,一并作为研究对象,纳入中原姓氏入闽迁台的研究范围,既是对中原姓氏入闽迁台相关研究30年学术史的总结,也是两岸青年在学术文化交流中发现的真