基于深度学习的手势识别的研究

来源 :西北师范大学 | 被引量 : 0次 | 上传用户:dillydally
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年以来,由于工业社会的急速发展,导致听力障碍患者的数量显著增加。随着人工智能技术的日益发展,研究人员不断地为残障人士带来新的辅助技术。传统的模式识别技术,如隐马尔可夫模型、支持向量机和反向传播算法已经应用在手势识别上,并且获得了一定的成果,但识别效果并不是很好。随着卷积神经网络(convolutional neural network,CNN)的迅速发展,基于CNN的方法在手势识别领域取得了更为显著的效果。然而,基于CNN的方法需要大量的训练数据,模型训练对于硬件要求较高。论文针对在数据集较小,和硬件条件一般的情况下,手势识别效果不理想的问题展开研究。论文的主要工作与创新如下:1.构建了一个较小规模的手势数据库。使用美国手势数据集,该数据集提供了5个人采集的24个手势表达形式的英文字母图像(J和Z除外)。论文使用了其中12000张不同大小的图片,每个字母图像有500张RGB图片。论文使用传统的图片数据集扩充方法(加噪,旋转等)进行数据增强。在此基础上使用DCGAN网络进行图片生成,最终得到了168000张标准的实验数据。2.提出了2种用于手势识别的轻量级CNN网络:Mobile Net和Shuffle Net,解决了传统CNN模型体积较大、不便于移动端设备的嵌入使用问题。实验结果表明,在相同实验数据集的情况下,Mobile Net-v2和Shuffle Net-v2的识别准确率分别达到了90.93%、91.13%,参数量为6.9M和3.4M。实验中传统CNN方法中效果最优的Res Net50识别准确率为93.65%,但是模型参数量达到了25.6M。实验结果验证了轻量级CNN网络比传统的CNN网络在移动端使用时的优越性。3.提出了使用迁移学习进行手势识别的方法。论文使用了VGG16和Res Net50作为实验模型。在冻结其他层,只训练全连接层的情况下,需要训练的参数都为2.297M,而使用传统方法训练时需要训练的参数分别为138.4M和25.6M。同时在标准数据集和小数据集上分别进行实验,使用迁移学习方法时训练5个轮次模型基本拟合。实验数据为标准数据集时VGG16和Res Net50的识别准确率分别达到了92.6%和95.31%。实验数据为小数据集时识别准确率分别达到了86.17%和89.21%。实验结果表明在小数据集的情况下使用迁移学习,不仅可以提高识别率,同时模型也更容易拟合。4.提出了2种引入Transformer的手势识别方法:Visual Transformer(Vi T)和Convolutional Vision Transformer(Cv T)。使用Vi T模型训练进行手势识别的准确率仅为69.6%,使用Vi T的预训练模型进行迁移学习时识别准确率为90.6%。使用Cv T模型进行训练的识别准确率为72.6%。从实验结果来看,虽然将Transformer引入到手势识别未达到更优的效果,但是本文提出的方法为手势识别技术指出了一种新的发展思路。
其他文献
高岩温输水隧洞对喷射混凝土的性能会产生显著不利影响,配置高性能喷射混凝土对此类工程具有十分重要的意义。针对高岩温条件下,聚丙烯纤维的掺入对喷射混凝土性能的影响进行了探讨和分析。结果表明,在喷射混凝土中掺入一定量的聚丙烯纤维,可以有效提升高岩温环境下喷射混凝土的性能,其最佳掺量为0.6 kg/m~3。
学位
为降低航空物流运输成本,提高航空物流运输能力、航空货运量和货运服务质量,在传统遗传算法的基础上,建立航空物流配送路径优化模型。对问题进行格雷码编码处理和遗传算法的交叉、变异操作。为提升算法的搜索精度和收敛速度,提出一种自适应变异方法来提升种群的多样性。引入模拟退火算法的Metropolis准则,提升路径规划效率,实现全局的最优化路径目标寻找。将改进算法应用于航空多枢纽物流路径规划,很好地解决了航空
元交际对于幼儿的语言发展及社会性发展具有重要意义。具体表现为:元交际同幼儿叙事能力、语用能力、社会观点采择能力及幽默感的发展息息相关。幼儿教师可通过遵循幼儿元交际能力的发展规律,有针对性地培养幼儿的社会观点采择能力,创设有利于元交际发展的游戏环境,并把握一日生活中的元交际发展契机,以促进幼儿元交际能力的发展。
语文教材中的女性形象是语文教学中重要的专题,对学生形成正确的性别平等观有着潜移默化的影响。论文从女性主义的视角,对现行的初中教材中的女性形象进行分析和研究,提出教材中的女性形象所折射出的问题,并提出对策和建议。
房地产项目是指在土地及地上建筑进行投资开发的建设项目,具有高风险、高投入等的特点,需加强房地产项目管理,确保其达到理想的社会效益和经济效益。房地产项目具有较完善的体系,主要包括决策阶段、设计阶段、实施阶段;但也存在技术、人力、时间等方面的问题。因此,文章针对新形势下房地产项目管理中存在的问题进行研究,并提出行之有效的解决对策,以确保房地产项目的顺利进行。
保障系统在医院的运行中扮演着极其重要的角色,主要为医院提供各类物质的供应与处置,主要包括有水、电、暖、医疗物资、餐饮等的供应,以及污染的医疗物资、被服、污水、污物、垃圾及尸体等的处理,为医院各项工作有序地开展,提供保障支持。但保障系统往往是医院设计中最容易忽视的部分。武汉在1864年创办了华中地区的首家西式医院,在此后的100年内创办了多达100多家医院,是内陆地区创办医院最早,数量最多的城市之一
<正>2021年6月中国美术馆举办了“妙笔传神—中国美术馆藏任伯年人物画特展”,掀起了2021年任伯年展览的热潮。该展是在中国美术馆于2019年香港中文大学文物馆举办的“妙笔传神”特展基础上再次举办的同名展览,整合了原来的展览板块,并新增了“源·流:任伯年人物画之承变影响”部分,以展现任伯年人物画的师承和影响。2021年12月,中国美术馆又与南京博物院共同主办了“如镜取影妙得神形—中国美术馆、南京
期刊
新时代的教育总是要有新时代的面貌,学生德智体美劳的全面发展是新时代素质教育的重要目的,同时德育教育作为学生学习发展过程中不可或缺的重要因素,在各个学科中都应当进行适当的渗透。教师应当思考,新时代的素质教育体系,为何将"德"放在首位,自身在课堂教学中,又要如何将课程学习与"德"育相互融合。语文学科作为一门基础性学科,对于学生的未来发展有着极大地影响,而小学时期又是学生建立坚实学习基础的关键时期,为了
介绍载荷抗力系数设计(Load and Resistance Factor Design, LRFD)方法的背景和原理。在此基础上,以某深水半潜式钻井平台的舵机基座强度分析为例,基于挪威船级社海洋结构物设计规范和经典力学理论,展示LRFD方法在海洋结构物局部结构强度分析中的实际应用,表明该方法的特点。