基于深度学习的手势识别应用研究

来源 :安徽工程大学 | 被引量 : 5次 | 上传用户:wayyy111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机科学的发展促进了人机交互技术的进步。从早期输入文本命令的交互方式开始,人机交互方式逐渐向自然化、直观化的方向发展。手势作为人机交互方式的一种,具有丰富、灵活、直观等特点,且符合人们日常的生活和交流习惯。近年来,基于手势识别的人机交互方式逐渐引起了研究者们的关注。手势识别方法可分成基于外部设备的方法和基于计算机视觉的方法。基于外部设备的手势识别方法,如数据手套等方式已经相当成熟,并被广泛应用。而基于计算机视觉的手势识别方法仍然不够成熟,传统手势识别方法一般都是基于支持向量机和人工神经网络等浅层机器学习算法,手势的识别率难以达到应用级别的要求,且传统算法的提升空间较小。近年来,深度学习的兴起为手势识别提供了新的思路。文章介绍了深度学习的相关理论,并主要就深度学习的三个常用网络模型进行说明和分析,最终选取了最适合手势识别的卷积神经网络作为本文的研究重点。随后对静态手势识别的主要步骤进行了说明,并给出了每一步骤具体的处理方法。初步设计了一种八层的卷积神经网络用于手势识别。研究了影响卷积神经网络性能的两种因素,梯度下降策略的选择和全连接层神经元个数的多少。最终得出选用Ada Delta梯度下降法在全连接层神经元个数500个时在手势测试集上能取得最好的识别效果。随后文章对初步设计的卷积神经网络手势识别方法进行了改进。首先是手势的预处理部分,采用椭圆肤色模型在YCr Cb颜色空间下进行手势分割,并将分割出的手势进一步处理得出二值化的手势样本。经过处理后的手势样本更有利于手势特征的提取。其次根据之前的研究对网络进行改进,得到一种新的卷积神经网络结构。并在网络中加入了Inception结构,提升了网络的性能。对于给定的五种手势,在测试集上取得了98.6%的平均识别率。在实际系统中进行测试也能达到较好的识别效果,并且确保了系统的实时性。最后文章设计了一种手势控制浏览器,对本文提出的手势识别方法进行具体的应用。手势控制浏览器的设计遵循了软件设计的一般步骤,首先对浏览器功能进行分析,将浏览器分为基础模块和手势模块。然后对浏览器分模块设计,基础模块通过图形化的开发环境Qt来完成,而手势模块则定义了四种控制手势,通过文中提出的卷积神经网络训练手势模型进行识别。整个浏览器的代码编写均采用C++语言来完成。经测试,在开启了浏览器的手势模式后,给定的四种控制手势能够对浏览器进行有效的控制。
其他文献
<正>荀子的《劝学》、韩愈的《师说》是中国古代关于教与学不朽的名作。有缘于此,本人的这篇《师生说》基于我三十余年的校园生活。九岁上学、25岁教学、36岁攻硕,我几乎从未
期刊
当下,一些村庄经济薄弱、组织软弱、民心涣散问 题仍然存在,实践中创造了选任经济能人带班子、党支部统领 发展集体经济、党支部合并强党建、龙头企业以兼并方式融合 等很多
笔者诊治1例十二指肠穿透性溃疡,现报道如下:1临床资料患者,女,46岁。反复右下腹痛12d,加重9h入院。起始表现为右下腹间断性绞痛,无腰背部放射痛,无腹泻、黏脓血便,无肛门停止排便排
随着时代的发展,也为了顺应国际化潮流,英语成为了一种重要的交流方式。因此,在学校教育方面,英语就成为了很重要的一门功课。提高学生的英语水平,不仅是为了满足社会的需要,
产品广泛应用于恒压供水、恒温控制、纺织、印染、洗涤、线缆、包装、机械、陶瓷或各种OEM。高性能优化空间失量变压变频算法,效率高、噪音和电磁干扰小
本论文以香蕉皮为主要原料,采用正交实验研发香蕉皮类混凝剂(OBP及BBP),并采用电镜扫描(SEM)、能谱分析(EDS)和红外光谱(FI-IR)对其进行微观表征,同时对其储存稳定性和混凝稳
生态保护红线是生态保护区域的边界线,同时也是自然环境安全的底线。划定生态保护红线,不仅可以达到保护生态环境,保护自然资源的目的,同时也对实现城市的可持续发展有一定的
电解锰行业在生产过程中会产生大量的高浓度氨氮废水,其中就包括锰渣库中所产生的氨氮浓度高达500mg/L以上的锰渣渗滤液。水中氨氮超标会引起水体富营养化,对水生态系统和人
研究背景与目的:随着我国经济的快速发展,人民的日常行为和生活方式发生了巨大的改变,慢性病已成为严重影响我国社会居民生活质量甚至危害生命健康的重要因素,人们不良的生活