基于深度学习的手势识别方法研究

来源 :江南大学 | 被引量 : 0次 | 上传用户:XULIANSHUAI
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能和人机交互领域的不断发展,手势识别技术得到了越来越广泛的应用,而在实际生产生活中的许多使用场景和需求的限制下,基于深度学习的视觉动态手势识别方法设计逐渐成为了一个重要的研究方向。从不同角度对目前的研究现状进行分析可以发现,该领域仍然存在着许多亟待解决的难题。在微观视角下,多数研究使用经典的3D卷积模块作为基础构成搭建深度学习模型,实现了时空特征的提取,但往往忽略了由此所产生的模型规模庞大和时域信息难以有效建模等影响因素。在宏观视角下,如何兼顾模型的运行效率和对全局相关性信息的整合能力是一个值得关注和研究的问题。此外,在一些特殊的应用环境下,单模态数据无法提供充足的有效信息,所以对于多样化的数据形式进行更好地融合能够在一定程度上提高总体识别效果。本文主要对深度学习领域的视觉动态手势识别方法进行了深入研究,并取得了以下成果:(1)针对基于卷积神经网络的识别方法中出现的网络规模庞大、时序信息难以建模、有效特征提取能力不足等问题,提出了一种时域多尺度融合的时空卷积结构和一种全局信息同步的特征通道注意力模块,并以此为基础构建了深度学习模型。在特征提取过程中,分别通过空间域卷积和时间域的类残差卷积结构提取多尺度感受野范围的时空特征,解决时序上下文信息缺失问题。对于获取到的一系列时空特征,进一步通过全局性和显著性信息进行编码,使用极少量的训练参数构建通道间的全局依赖关系,提高模型的特征表达能力。消融实验的结果表明,所搭建的网络结构将识别准确率总体提升了4.45个百分点,并且显著优化了模型的参数规模。通过与其他先进方法进行对比,进一步验证了模型的有效性。(2)针对目前的深度学习网络框架并行运算能力差、对于全局相关性信息整合能力不足等问题,设计了一种时空自注意力模块,并将该结构与卷积神经网络进行融合,同时借助分组机制的特性,构建了一种复合型的深度学习架构。首先,模型将自注意力机制用于处理高级时空特征,通过高维张量间的矩阵关系对全局相关性信息进行建模,并且保证了模型整体上的并行运算能力。其次,引入的分组机制能够在一定程度上降低模型的复杂度,同时获得丰富的多元信息。通过进行性能分析和消融实验,验证了时空自注意力模块对于模型总体识别效果的提升是有效的。多种识别方法之间的对比结果也充分证明了所构建的复合型网络框架的优势。(3)针对单模态数据所提供的有效信息不足而产生的准确率难以提升、模型鲁棒性差等问题,引入了一种时空特征互信息模块,并将其用于构建多模态融合方法。对于多种数据类型驱动的深度学习模型,在其中一些关键的特征提取节点实现模态之间的信息流通,同时弱化各层级时空特征所包含的冗余信息,最后利用单节点融合策略的优势输出最终的识别结果。消融实验和对比实验结果显示,所使用的融合方法实现了超过2%的识别准确率提升,达到较好的动态手势识别效果。综上所述,本文在多个方面详细分析了用于动态手势识别的深度学习模型,分别从微观结构组成、宏观框架构建、多模态数据信息流通等研究方向着手,针对存在的问题搭建了相应的网络结构,最后通过实验进行了验证,达到了预期的研究目标。
其他文献
上市公司的护盘式回购中潜伏着道德风险。公开披露的股份回购方案为要约邀请,是公司决议与信息披露文件,接受民法、公司法与证券法三重规制。公司推出回购方案时要恪守“原则禁止、例外允许”要求,量力而行、适度承诺。公司违反要约邀请规则、滥用要约邀请自由时,对善意信赖方案的公众股东承担缔约过失责任。董监高参与审议决定方案时若有恶意或重大过失,要对公司、股东或第三人承担赔偿责任。若方案信息披露中存在虚假陈述、内
新时代应用型高校是我国教育体系非常重要的组成部分,高校体育在应用型人才培养过程中扮演着重要的角色。该研究在遵循基本教学原则的基础上,积极发挥应用型高校的机制优势,大胆探索,创造先进经验,通过线上+线下的模式,将应用型高校体育礼仪教学体系与应用型高校体育的组织形式深度融合,通过学生、教师、教学方法、礼仪课程、教学目的、教学环境和教学反馈等教学诸要素构建应用型高校体育礼仪教学体系,积极探索应用型高校体
【背景】产香酵母可赋予葡萄酒独特的香气,因此分离筛选优良产香酵母对酿造具有地域风味的特色葡萄酒具有重要意义。【目的】从中条山野生葡萄中筛选产香酵母,进行种群鉴定和生理生化特性研究,并将其应用于葡萄酒发酵过程,研究其对葡萄酒香气成分的影响。【方法】采用稀释涂布平板法从中条山野葡萄中分离筛选酵母菌,对其进行分子生物学鉴定。优选其中具有显著香气的产香酵母,与酿酒酵母F15进行混合发酵,采用GC-MS对香
野生葡萄类群有一半以上分布在中国.学者们基于形态特征和核基因组对其系统发育关系进行了研究,但结果存在比较大的冲突,类群间的亲缘关系仍未明确.为探究基于叶绿体基因组重建的中国野生葡萄的系统发育关系与前人基于形态特征或核基因组的研究结果是否一致,本研究从已公布的重测序数据中组装出26个中国野生葡萄的叶绿体基因组,并使用联合分析和溯祖理论重建了这26个类群的系统发育关系.联合分析的结果将中国野生葡萄分成
葡萄霜霉病是葡萄最严重的病害之一,由葡萄霜霉菌[Plasmopara viticola(Berk.&M.A.Curtis)Berl.&De Toni]引起。欧亚种葡萄(Vitis vinifera.L)品质好、商业价值高,缺点是不抗葡萄霜霉病。中国作为葡萄属植物重要的起源地之一,有丰富的高抗葡萄霜霉病的野生葡萄种质资源,挖掘其内在的抗性基因,对于改良欧亚种葡萄抗病性具有重要意义。本研究将抗霜霉病的
上世纪中叶,西藏作为油画题材来源地,已引起画界的广泛关注。文章以研究现实主义绘画风格为切入点,采用比较研究法,对我国近年来西藏题材油画创作做阶段性评述,通过回顾我国西藏油画创作的历史图景以及现实主义美学思想,引出油画民族化现象的学理脉络。文章重点论述陈丹青《西藏组画》的创作思想,对陈丹青《西藏组画》中现实主义创作原理的运用进行深入分析。陈丹青以其明确的创作思想、创新精神和纯正的油画语言描绘了西藏普
为考察重金属Cd对於术Atractylodes macrocephala cv.Yuzhu种子萌发及其生理指标的影响,以清水(0mg·L-1)作为对照,用0.1、1.0、5.0、10.0、30.0、50.0、100.0 mg·L-1 CdCl2(以Cd2+计)溶液对於术种子进行浸泡处理,然后测定於术种子的发芽势、发芽率、芽长、根长、根系活力、硝酸还原酶含量、可溶性糖含量和可溶性蛋白含量。研究结果表
带式运输输送机作为煤炭开采过程中重要的运输设备,具有适应能力强、运输距离长、运载重量多等特征,可以通过自动化控制实现高效率工作,当前主要应用于煤炭采掘、煤炭运输、煤炭加工等诸多环节,具有重要的应用价值。然而,在实际开采煤炭的过程中,考虑到周边环境极其恶劣,如果带式输送机工作时间过长,承载的负荷过重,极其容易发生跑偏、断裂、打滑的问题,甚至引发火灾或爆炸性安全事故,影响着煤矿生产的安全性。所以,煤矿
葡萄是世界上跨越南北的最重要经济型水果作物之一,欧洲葡萄品种因其品质优良产量高作为主栽品种,创造了明显的经济效益。但是欧洲葡萄对病害的抵抗能力差,葡萄白粉病是一种严重危害葡萄生产的典型性真菌病害,造成葡萄减产降质。本文在前人研究的基础上,从中国野生葡萄转录因子家族中选取响应白粉菌诱导表达程度高的Vq MYB153、Vq ERF110、Vq WRKY53、Vq WRKY6、Vq MYB14和Vq M
近些年我国生物医药行业快速发展,在国家鼓励企业研发创新以及我国金融市场不断完善发展的外部环境下,一大批致力于创新药物研发的生物医药企业进入资本市场,推动了我国生物医药企业融资上市和并购交易进入高峰。面对生物医药企业特有的研发属性和价值构成特点,如何合理准确地评估生物医药企业价值,成为我国资本市场当下关注的热点问题。传统估值方法参考被评估企业历史销售数据以阶段增长模型来预测企业未来销售业绩变化状况,