基于卷积神经网络的手势识别算法优化及嵌入式实现

来源 :西安邮电大学 | 被引量 : 10次 | 上传用户:zxc569148889
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的快速发展和计算机视觉技术的成熟,基于视觉的手势识别应用逐渐成为人工智能(Artificial Intelligence,AI)领域的一个重要研究方向。手势作为一种十分自然的语义表达方式,在人机交互(Human Computer Interaction,HCI)中发挥着重要的作用。但是,复杂的手势结构和多变的环境增加了手势识别的难度,导致识别率低下。卷积神经网络(Convolutional neural network,CNN)改善了传统识别方法存在的需要手工选取特征的问题,目前在视频监控、人机交互、大数据分析等领域得到了广泛的应用。这些领域对算法实现的实时性要求也越来越高,这使得研究如何使用FPGA对CNN算法进行加速显得尤为重要。因此,本文结合手势识别技术,对卷积神经网络在ZC706平台的嵌入式实现进行研究,具体工作如下:(1)针对复杂的手势结构、光照、背景和环境等因素会影响识别的精确性且人工选取特征难以适应手势多变性的问题,给出了一种结合肤色模型和卷积神经网络的手势识别方案。对不同背景下的手势图像,首先选择合适的肤色模型分割出手势区域,然后采用形态学操作、滤波、连通域标记等算法对手势区域进行提取和重建。最后结合深度学习的卷积神经网络方法,构建了基于手势灰度图像的网络模型。实验结果表明,CNN能够高效地进行特征学习,该网络在自建数据集和Massey数据集下对手势的平均识别率都达到98%以上。(2)与手势识别系统的PC实现相比,嵌入式实现具有更灵活、应用更广泛的优势。考虑到手势识别系统的实时性要求,并且CNN的计算模式适合于硬件加速,给出了一种基于FPGA的CNN加速器设计方案。Xilinx提供的Vivado HLS开发环境能够把可综合的高级编程语言C/C++转换成RTL级实现,从而缩短开发周期。因此,本文基于ZC706开发平台,在HLS环境下采用流水线优化、循环展开、存储优化、定点量化等方法实现了用于手势识别的7层CNN加速器。实验结果表明,CNN加速器的实现频率为200MHz,在ZC706上实现了22.04GMACS的峰值性能和16.76GOP/s/W的能效比,该实现比Core i5 2450M CPU下的Matlab实现快126倍,比NVidia GTX 840M GPU实现速度快10倍,与GPU相比,功耗降低了12倍。(3)针对在嵌入式平台运行手势识别算法实时性差的问题,结合ZC706平台FPGA+ARM的架构,采用软硬件协同的方式进行原型系统的设计与实现。该系统在ARM端实现摄像头的视频采集和手势分割,FPGA端实现基于卷积神经网络的手势识别算法的硬件加速、图像传输以及HDMI高清显示,探索了一种便捷、低成本、低功耗的手势识别嵌入式解决方案。
其他文献
自1988年美国学者应用分子克隆技术获得戊型肝炎的基础克隆以来,我国新疆等地陆续报道戊肝流行,本文就我院近3年收治的132例急性散发性戊肝进行分析,报道如下。
沟通是人与人之间、人与群体之间思想和感情传递、反馈,从而达成思想一致和感情通畅的过程。在城市管理中,城管部门之所以与市民群众产生这样或那样的矛盾,原因之一就是双方缺乏
<正> 凡是接触到外贸英语的人都会发觉许多英语词汇看似认识,可放到句中或信函中正确理解和翻译却不那么容易。因为这些词汇除有其基本含义外都具有了其特定的专业意义。只有
深水集束动态电缆是我国重点发展的海洋工程装备。随着南海油气田开发逐步走向深水,集束动态电缆的应用将日益广泛,由于受到国外少数制造商供货的限制,在一定程度上制约了深
目的探讨螺内酯治疗慢性心力衰竭患者的临床疗效及其对患者血清N末端B型钠尿肽前体和心功能分级情况的影响。方法选取2018年2月至2019年4月治疗的慢性心力衰竭患者108例,分为
8月7日,由住建部正式批准的《中国城市综合管理体制及其运行机制研究》课题研究大纲公开征求意见。课题研究大纲提出了“大城管”概念,即城市综合管理。
本文结合赣定高速公路桃江特大桥的施工实践,介绍了预应力砼连续T梁的施工要点和相关技术难点的处理.
为解决尚庄井东翼采区的防突问题,在3652顺槽底板中掘一条底板岩巷,超前于3652顺槽,利用岩巷打煤层抽放孔,预抽3652顺槽前方及两帮瓦斯,使3652顺槽煤巷安全施工.
介绍高速公路工程原材料的检测和质量管理措施.
我国燃煤电厂装机比例提高趋势正在加剧。