基于深度学习的实时动态手势识别

来源 :浙江大学 | 被引量 : 0次 | 上传用户:yng2005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机的普及和发展,人机交互技术已经成为人们日常生活中不可或缺的一部分。无需可穿戴设备的手势交互方式因其自然、便捷的操作,已经成为一种新兴的人机交互方式,可以广泛应用在游戏制作、医疗器械操作和多媒体设备操控等场景中。因此近年来随着深度学习技术的成熟,基于计算机视觉的手势识别技术成为了人机交互中一个炙手可热的研究领域。许多研究为了探究准确性更高的卷积神经网络,单纯地从离线测试的角度进行网络结构设计,加大网络规模与计算量,而忽略了在移动平台部署系统的可行性。此外在实际应用场景下,如何处理不断输入的视频流,在保证系统实时性的前提下进行在线检测与识别也一定程度上加大了手势识别的难度。针对以上不足和难点,本论文以保证系统实时性与部署的可行性为前提,构建了更加贴近实际人机交互场景的动态手势数据集101Gesture,设计了轻量级动态手势检测网络以及识别网络,实现了完整的实时动态手势识别系统。本论文的主要工作以及创新研究成果如下:1.构建了动态手势数据集101Gesture。针对动态手势识别的难点以及现有数据集的不足,本文从实际应用场景出发,构建了更加贴近实际人机交互场景,动作实例长度多样性更加丰富的手势数据集101Gesture,并通过不同数据集的比较,说明该数据集的优势与特点。2.设计了轻量级手势检测网络MotionNet及识别网络ActionNet。从轻量级手势识别的角度出发,手势检测网络利用RGB图像中的空间信息以及差分图像中的时序运动信息,在不断输入的视频流中进行手势实例检测。手势识别网络利用多层次、多尺度的特征融合,使其能够适应实际场景中动作的时间尺度的不一致性,保证网络的准确度和鲁棒性,进行手势分类。3.设计了完整的实时动态手势识别系统。从实际应用场景出发,基于轻量级网络Mo-tionNet与ActionNet,结合了缓冲队列机制,分别设计了手势检测器与手势分类器,并将其串联后通过滤波器后处理进行输出。该方法将检测器作为分类器的“开关”,可以使卷积神经网络能够通过使用滑动窗口的方法有效地在线运行,并最大程度地节约计算资源以及存储资源。
其他文献
目的分析筋骨草对抗炎作用机理,探究其抗感染效果。方法配置热炎宁溶液,同时配置筋骨草药物溶液,分为低、中、高不同浓度,同时设置对照组,每组30只小白鼠,分别于第7d和第14d
生产力范畴演进的历时性表明生产力是自然要素和人类社会要素的整合,并以生态和谐与人态和谐的高度有机统一为价值趋向.遵循可持续和谐发展观的逻辑理念,广义生产力是一个以
耐力运动员较少进行力量训练,主要担心肌肉肥大对毛细血管和线粒体功能产生潜在负性的影响。但是肌肉的无氧工作能力、肌肉力量和肌肉的爆发力可能影响耐力运动项目的成绩。力
目的:探讨分析超声乳化晶状体摘除术联合小梁切除术在治疗原发性闭角型青光眼合并白内障的临床疗效及安全性。方法2013年2月-2015年5月收住我院的原发性闭角型青光眼合并白内
<正> 企业识别手册(Corporate I-dentification Manual),也叫企业CIS标准手册。是设计开发作业完成,经过市场调查、效果测试后,确定标志、标准字体、标准色等基本要素,并依照
重庆东北部地区巫溪天星河、文峰河的岩溶流域水化学特征研究结果表明:研究区泉水样品的p H值为6.47~8.28,平均值为7.79;流域河水饱和指数(SIc)的平均值为0.14,表明其变化受到流
合作社对于发展我国经济、应对经济全球化挑战发挥着日益重要的作用,世界上大多数国家和地区的人们都享受到了合作社的好处。但有关合作社运动应自下而上地产生,还是通过国家
油页岩及干馏产物在露天堆积过程中,由于自然降雨,其中大量有害元素会被淋出迁移到环境中,造成污染。本文以抚顺油页岩及其干馏产物为研究对象,模拟自然降雨,研究不同淋滤条
足球进攻战术正围绕"快速"发生变革,快速反击和快速进攻已成为世界强队进攻战术之首选,阵地进攻效率越来越低,本届杯赛各队利用快速反击和快速进攻共进58球,占40%,而阵地进攻只