基于卷积神经网络的手势识别算法研究

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:planktonli
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,手势以其自然快捷的特点成为了一个十分活跃的计算机视觉研究课题,手势识别可以应用于许多领域,如让失语和失聪患者能够与他人交流、体感游戏、远程操控等,手势识别因此吸引了人们大量的关注和研究。已有的手势识别算法在背景干扰及光照变化等情况下存在计算量大、耗时长、识别率低的问题。深度学习在语音识别、视觉识别和自然语言处理等很多方面的表现都非常不错。在不同类型的深度学习架构中,卷积神经网络(Convolutional Neural Network,CNN)是最适合处理图像数据的。本文的主要工作和成果如下:1.简单介绍了传统的手势识别方法—模板匹配法和隐马尔克夫模型法,重点介绍了基于CNN的手势识别方法,概述手势识别过程中涉及到的相关理论。2.在研究没有检测阶段的手势识别算法时,本文提出了Hand-CNN手势识别算法,该算法主要用于识别目标与背景比例较大的图像中的手势。Hand-CNN算法主要调整AlexNet模型的网络结构,并使用特征融合的方法进行改进以提高手势识别的准确率。实验结果表明,Hand-CNN算法在美国手语(American Sign Language,ASL)数据集上的准确率达到98.2%,相比原来的AlexNet模型,识别率提高了3.2%。3.在研究先检测后识别的手势识别算法时,本文提出了基于Faster RCNN的手势识别算法,该算法主要用于识别目标与背景比例较小的图像中的手势。修改Faster RCNN中的关键参数,达到同时检测和识别手势的目的;然后提出扰动交叠率(DisturbIoU)算法,避免训练模型的过拟合问题,进一步提高识别准确率。在数据集NTU和VIVA上进行手势识别实验的结果表明,该算法有效地避免了训练模型的过拟合问题,比传统算法具有更高的识别准确率和更强的鲁棒性。4.经对比实验证明,本文创新使用的手势识别方法要比传统的一些方法优良和先进得多。
其他文献
在现代复杂多变的理财环境中,以战略思维来指导企业财务工作显得越来越重要。现代企业制度下企业财务战略具有全局性、长期性、综合性、从属性和导向性。现代企业制度的建立
<正> 世人所知道的肖洛霍夫(1905—1984)是苏联的一位文学巨人,其作品影响之大,读者之多,在苏联作家中罕有其匹。截至1980年1月,他的作品用苏联各民族的54种语言和30种外国语
时下,民营书店面临着激烈的市场竞争,同时多多少少存在着一些后备资金不足、社会舆论不佳等方面的问题,必须要在经营管理上学习优秀的经验,立足于企业的长期发展,才能在市场
俄罗斯具有丰富的自然资源以及市场机遇。其地区层面投资环境面临亟待解决的问题有地区吸引外资准备不足、基础设施不够完备、国家支持力度不够、腐败问题未得到控制等。俄罗
文章介绍了在津滨高速改扩建工程中仓库区地道泵站采用工字钢桩加搅拌桩相结合的围护结构,在施工中取得了良好的工程效果。
目的研究认知行为干预能否改善患者在牙周病系统支持治疗阶段的依从性。方法将780例就诊的临床诊断为"慢性牙周炎"的患者随机分为对照组和试验组,在基础治疗后6个月分别测量并
【正】 一《晏子春秋》是记录春秋时期齐国名相晏婴言行的一部著作。最早记载该书的是司马迁的《史记》,他在《管晏列传》中云:“吾读管氏《牧民》、《山高》、《乘马》、《
郭店楚简的发现 ,学术价值很大。1、有助于文献交流史的研究 ,可推知早期儒道文献主要通过教育、不同的儒道学派、列国间相互交流以及战争等途径来传播。2、有助于了解先秦简
随着农业结构的不断调整,我市苹果生产有了较快的发展。据统计,到2005年底,全市苹果面积15.7万hm^2,产量266万t;已建成气调库、冷风库523座,库容量158万t;洗果、打蜡、烘干自动生产线
本文主要从《我纷纷的情欲》的意识表达效果来分析木心诗歌的精神指向,阐述木心在《我纷纷的情欲》表达的主要方式、象征主义手法的综合运用以及特质鲜明的精神世界。并结合