基于深度学习的手势识别算法研究

来源 :成都理工大学 | 被引量 : 0次 | 上传用户:ilovemn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人们在日常生活中经常使用一些手势进行交流,通过手势识别来实现人机交互的技术可以很自然地应用于手语识别、车载设备控制、智能家居等方面,是未来人机自然交互的重点研究方向之一。但就交互而言,手势识别的实时性和准确性是关键。传统的手势识别研究已经进入瓶颈期,很难在实时性和准确性上更进一步,深度学习的快速发展为手势识别提供了一个新的研究方向。本文首先分析了手势识别的研究背景及研究意义,介绍了研究现状和发展趋势,然后对本文的主要研究内容和组织结构进行了说明;接着对传统手势识别方法和基于深度学习的手势识别方法中常用的技术做了简单介绍,并对比了这两种方法的优缺点,选择将基于深度学习的手势识别方法做为本文的研究重点;然后分析了YOLOv3算法在同类型算法中的优越性,选择基于YOLOv3算法实现手势识别;对目前主流的学习框架进行了简单介绍,选择使用Py Torch框架对手势识别算法进行开发,并对本文算法实现环境作了说明;接着研究了YOLOv3算法的网络结构和损失函数,介绍了相关的算法评价指标,并针对手势识别对YOLOv3算法提出了三点改进方案,为之后算法的改进奠定基础;接着说明了数据集对深度学习算法的重要性,通过对比现有的公开手势数据集,选择适合本文手势识别研究的NUS Hand Posture dataset-II手势数据集与自制的手势数据集进行融合,并通过数据增强的方法,创建了包含12600张复杂背景图片的融合手势数据集,通过实验验证了融合手势数据集的优越性;接着对Darknet-53网络结构进行了优化,说明了优化思想和优化方法,增加了一个下采样层和残差块,减少了部分残差块中残差单元的数量,减少了部分卷积层中卷积核的数量,并对优化后的网络结构进行了效果验证;然后对YOLOv3的预测输出层做了改进,对改进思想和改进方法做了说明,改变了输出尺度的大小和数量,改变了anchor box的数量并根据融合手势数据集重新聚类生成了新的参数,对改进后的预测输出层进行了效果验证。然后对本文提出的F-YOLOv3算法做了应用测试,平均手势识别速度为31ms,准确率为97.1%。测试结果表明本文基于YOLOv3改进的FYOLOv3手势识别算法具有较快的识别速度与较高的准确率。
其他文献
随着现代烟草农业的深入推进,国家烟草专卖局(以下简称国家局)对烟叶工作提出“守住一条红线、提高三个水平、夯实两个基础”的工作目标,为全面落实国家局工作要求,有效的考核体系是基础保障。然而,当前永州市烟草公司烟叶线考核体系存在诸多弊端,需要进一步改进完善,以促进各项工作落到实处,全面提升烟叶生产水平和生产效率。本文以永州市烟草公司烟叶线考核体系为研究对象,以激发烟叶线员工工作积极性、提升工作效率为目
当前,中国正处于转型升级的关键时期,市场环境错综复杂,为破解社会发展难题,政府高瞻远瞩,将实施大众创业为解决问题的着眼点。实施积极的创业政策有利于社会创新活力的迸发,
作为一种先进分离技术,纳滤(Nanoflitration,简称NF)广泛用于水和废水的处理。纳滤水处理过程中,为防止膜结垢需要向进水中添加阻垢剂;纳滤处理循环冷却水的排污水时,水中也是含阻垢剂的。然而,阻垢剂对纳滤工艺性能的影响尚缺乏深入研究。本文选择典型阻垢剂氨基三亚甲基磷酸(Aminotris(methylenephosphonic acid),简称ATMP),通过纳滤膜的透过实验及扫描电子显
近年来,随着社交媒体的兴起,谣言所带来的问题比以往任何时候都更加严重。由于谣言涉及经济、健康、政治等公共话题,其真实性、正确性无法被及时验证或永远都没有办法被验证。这些谣言带有未经证实甚至是虚假的信息,可能会引起公众恐慌,进而造成严重的经济损失,对社会产生不良影响。面对社交媒体上的海量信息,专业人士鉴别谣言所需的时间和精力是巨大的,且存在识别滞后,覆盖不全面等问题。因此研究和设计兼具准确率,覆盖率
边坡可靠度分析在岩土工程中得到了越来越多的应用,传统的概率可靠度分析已经发展的较完善。然而,实际岩土工程中,数据信息少,难以获取各参数的精确分布,使传统的概率可靠度分析方法的应用受到限制。因此,非常有必要引入非概率可靠度分析方法来分析边坡稳定性。一般来说,非概率可靠度分析模型只需随机变量的变化范围即可,突破了传统概率求解可靠度的局限性。本文以椭球模型为研究对象,将其应用于无限长边坡、二维边坡的可靠
视觉概念是视觉认知的基本单位。从哲学及认知心理学的角度出发,视觉概念可以被定义为一组视觉属性的抽象。洞悉大脑如何学习、组织、表达和理解视觉概念对构建人工视觉认知系统至关重要。近年来,以深度学习为代表的视觉计算模型在物体分类,物体检测,语义分割以及图像描述等领域取得了许多令人瞩目的成就。尽管取得了巨大的进步,这些模型并不关心大脑是如何表征和理解视觉概念的。传统的视觉计算模型更倾向于学习语言符号和视觉
现代化工企业在不断发展壮大的过程中,日益面临着安全风险压力。除了国家对于企业的安全管理提出更高要求,更高标准的同时,企业自身也益发重视通过安全管理来减少人员伤亡和财产损失。因此化工企业的安全管理研究,对企业经营和管理的长期可持续性发展有着十分重要的现实意义。本文的研究内容为A化工企业的安全管理,论文采用了实地调查法、案例分析法、文献分析法、失效模式分析法等研究方法。研究目的在于通过对A化工企业的安
变压器作为坚强智能电网的重要组成部分,对其预试定检、监控与诊断都显得尤为重要。在电力数据日益增长的背景下,针对变压器的预防性试验和在线监测数据,利用数据挖掘理论能够统计分析直流电阻变化量阈值,预测油中溶解气体发展趋势,诊断变压器故障,提早发现并排除安全隐患。本文以变压器直流电阻与油色谱数据作为研究对象,结合电力数据挖掘方法开展以下三方面研究:(1)针对目前试验规程规定的变压器绕组直流电阻变化量阈值
截至2018年12月,我国网民达到8.29亿,其中手机网民占比达98.6%。随着新媒体技术的发展和网民数量的不断增加,以政务微信号为代表的政务新媒体日趋成为传播政府信息、提供公共服务、提升社会治理能力的重要窗口。各级党媒的微信公众平台在“走、转、改”中起到了关键性作用。如何客观衡量考察政务微信公众平台的传播效果,探究其在多大程度上达到了“提高传播力、引导力、影响力、公信力,巩固壮大主流思想舆论”的
第一部分中性粒细胞淋巴细胞比值与房颤的相关性目的:目前关于炎症反应在房颤的发生和维持过程中的地位已经得到了广泛的认可,中性粒细胞淋巴细胞比值(NLR)作为新的炎症标志物得到关注,国外有研究证实了 NLR水平与房颤发生及维持存在相关性,但并未深入研究其与中国汉族人群之间的相关性,本研究旨在研究本地区人群的NLR水平与房颤发生发展的相关性,从而为本地区人群的房颤防治技术的提高提供相应的理论基础。研究方