基于深度学习和关键帧提取的哑语手势识别算法研究

来源 :南昌大学 | 被引量 : 0次 | 上传用户:thinkcell
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能在科研领域的快速发展,深度学习技术得到了普遍应用,手势识别技术在日常生活中提供了很大的便利。哑语手势识别技术有助于聋哑人与非聋哑人之间的智能交流。然而,现有的哑语手势识别算法仍然存在识别复杂手势困难、动态手语识别准确率低、视频序列数据训练中存在潜在问题等缺点。因此,提出一种适度且高精度的哑语手势识别算法是哑语手势识别领域的一个至关重要的研究课题。在现有的哑语手势识别算法中,主要有以下问题:(1)手语动作一般是由一连串的有序动作组成的,并且各动作之间是一种连贯的规律动作,所以,哑语手势识别算法只针对静态手语动作很难准确地识别一般具有复杂变化规律的哑语手势。(2)目前的研究热点是采用计算机视觉技术,利用深度摄像头采集视频流信息,哑语手势识别算法通过分析丰富的特征信息来分类特定的视频序列。由于采集的视频流中身体躯干部位所占的比例较大,所研究的重点对象手部相对来说比较小,如何处理手部运动在身体背景影响下的哑语手势动作识别也是一个难点问题。(3)另外,如何从视频序列中提取最有效的特征,也存在挑战性。对已有的特征进行分类也需要一个合适的分类器来配合完成。因此,设计一个高精度的哑语手势特征分类器也是一个重点难题。为了解决以上提出的难点问题,针对视频序列的RGB信息和骨骼信息,基于卷积神经网络和循环神经网络,本文提出的哑语手势识别算法有以下三点贡献:(1)提出一种基于深度三维残差神经网络和双向长短时期记忆网络的多模态动态手语识别方法,称为BLSTM-3D残差网络(简称B3D ResNet)。该网络模型用于从视频序列中提取时空特征,并在特征分析后建立对应于视频序列中每个动作的中间分数。通过设置分数阈值判定视频序列所属的类别,通过分类器对其分类和识别。(2)提出了一种基于Faster R-CNN模型的目标分割方法,将视频序列分成单帧图像,检测并定位手部位置,目的是为了减少网络模型的计算时间,提高模型的训练速率,并且减少身体背景对手指运动的影响。(3)提出了一种针对骨骼序列的关键帧提取算法,将关键帧看作是哑语手势视频序列的基本组成单元,提取视频序列关键帧,从视频序列中提取最有效的特征,可以大幅度地减少数据量,也能减少模型的计算复杂度。本文提出的网络模型共同训练RGB数据和骨骼数据,用同一个网络模型提取同一个手势动作的RGB信息特征和骨骼信息特征,同一个分类器对RGB信息特征和骨骼信息特征进行分类并得到一个预判分数值,对RGB数据和骨骼数据这两种数据类型赋予相应的权重,最后计算最终的分数值,分数值大于阈值的样本数据判定为真,从而达到识别哑语手势的目的。为了验证文中所提出算法的有效性,本文选择以下四个数据集:DEVISIGN_D数据集、SLR_Dataset数据集、DHG-14/28 Dataset数据集和SHREC’17 Track Dataset数据集,分别进行了模型训练与分类。与现有的哑语手势算法进行比较,本文的对比实验结果表明,所提出的哑语手势识别算法能获得相对较高的识别准确率。
其他文献
计算效率是模型修正在工程应用中的主要局限之一,而代理模型可以将设计变量与优化目标之间的未知关系运用显式函数进行近似表述,然后根据此函数关系式进行模型输入-输出静动
车载自组网是由车辆节点和路边单元节点构成的一种超大规模新型移动自组织网络,在改善交通管理和道路安全方面被寄予了厚望,同时也给人们带来了极大的隐私威胁。然而,面向传
PBL加劲型矩形钢管混凝土节点是一种新型桁架节点形式,目前对于该新型节点受力性能的研究较少,阻碍了矩形钢管混凝土桁架结构的应用与推广。有效分布宽度是研究节点受力性能
轮轨接触关系的研究是铁路交通安全运输的必要课题之一。我国铁路高速、重载的发展趋势直接导致轮轨间的动态相互作用加剧,严重影响车辆系统的安全性和平稳性,一旦列车发生脱
随着我国经济建设的逐步推进,以及美学概念的深入普及,近年来新建了大量的异型连续刚构桥,其中,桥梁抗震是评估其安全性能的关键指标。本文以一座295m长的V型墩连续刚构桥为
城镇建设的大力发展和城乡一体化的密切结合迫切地促进了大型基础设施、大体量构筑物和大型建筑物的发展,与此同时上部结构产生的超大载荷又促进了地下强硬支撑系统的发展。
现今机动车辆已经普及到人民群众的日常生活,无论在平时活动还是在运输作业中,机动车辆已成为一种不可替代的交通工具。但是,机动车所带来的安全隐患也不可忽视,比如在安保防
当前,我国正处于加快推进现代化、深化经济发展、促进社会发展转型的重要历史时期。然而伴随着快速的城市化、工业化,我国的环境风险事件频繁发生,造成严重的环境污染,导致环
装配式结构具有节能、环保、建造周期短等的特点。为了响应“十三五”规划的号召和实现建筑工业化的目标,大力推行装配式结构是我国建筑业可持续性发展的必然之选。目前,存在
随着新课程改革的推行,各种新型教育方式逐渐出现在课堂教学中。智慧课堂是通过先进的教学理念与先进的教学设施开展的一种新型教学模式。因此,在初中英语教学中,构建智慧课