面向动态手势识别的异步特征表示与时空正则化算法研究

来源 :贵州大学 | 被引量 : 0次 | 上传用户:xiaobaby2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
动态手势识别长期以来在增强现实、人机交互、手语识别等领域发挥着重要作用,近年来,深度学习为模式识别与计算机视觉提供了新的活力。然而,目前基于深度学习的动态手势识别算法依然面临以下几个问题:(1)动态手势外观多变性以及持续时间的随机性使识别的难度增大。(2)传统正则算法和数据增强应用于时空模型和动作数据时无法有效解决模型过拟合问题。针对以上问题,本文进行了相关研究和实验,主要内容如下:1.针对问题(1),提出了一种异步时空特征提取方法,首先,通过轻量级的三维卷积网络构建的短期异步时空特征抽取模块,使提取的手势特征具有多尺度的时空特性,从而保证对不同外观大小和速率手势的识别准确度;然后,通过改进的长短期记忆网络从短期异步特征中学习稳定长期时空特征,并将各个时间步态的时空特征进行融合,以进行最终的动态手势识别。2.针对问题(2),提出了一种时空丢弃正则化方法,称其为标签引导时空丢弃策略(LGST-Drop),它不仅可以在帧级水平进行结构化丢弃神经元,而且可以在通道和时间维度对运动信息进行正则,更重要的是,LGST-Drop的丢弃掩码是由网络的临时标签所引导生成的,从而降低选择丢弃区域的随机性以提升时空正则效果的稳定性。通过与其他主流方法进行实验对比,结果证明了所提出的基于多时域异步时空特征的模型能够显著提高手势识别性能,并且在多个典型数据集上表现出稳定的效果;另外将所提出时空丢弃正则化方法应用于多种识别网络,并与其他典型的正则化算法进行实验对比,结果表明所提出的LGST-Drop算法具有竞争力。
其他文献
“三农”问题一直是我国高度关注的话题。自乡村振兴战略提出以来,各方社会力量切身投入于农村建设,并取得了卓越成果。其中,农民专业合作社发挥了举足轻重的作用。基于此,文章对部分地区农民专业合作社发展状况进行研究、整理和分析,阐述了目前农民专业合作社发展存在的问题,并从服务带动、管理规范、品牌建设、融资能力、人才引进等多个角度提出了农民专业合作社发展优化策略,用以促进农民专业合作社高质量发展,为相关工作
期刊
对抗样本攻击是一种影响人脸识别系统安全性和鲁棒性的攻击手段。与传统对抗样本生成方法相比,基于生成对抗网络(Generative Adversarial Networks,GAN)的对抗样本生成方法具有生成速度快、可承载的计算量大等优势。然而,现有基于GAN的人脸对抗样本生成方法仍存在训练不稳定、生成对抗样本质量较低以及针对亚洲人脸的研究较少的问题。因此,本文通过梯度惩罚项优化生成对抗网络和训练目标
学位
在分布式环境下实现数据安全共享一直是研究热点,区块链以分布式共享全局账本的形式存储交易数据,为数据安全共享提供了平台支撑。然而,区块链上的交易信息对网络中全部节点公开透明,对用户隐私构成威胁。现有的区块链数据共享方案在进行隐私保护的同时可用性较低,数据共享难以实现隐私保护和可用性之间的平衡,有效实现区块链数据访问权限的动态调整是一个挑战性问题,这也是本文拟研究的问题。具体地,本文结合区块链技术、代
学位
发生在肝脏部位的肿瘤病变具有较高的致死率,及早从腹部CT图像中分割出肝脏和肝脏肿瘤是辅助医生对患者进行诊疗的关键。然而,人工分割耗时长,效率低;且CT图像具有对比度低、器官组织间灰度值较为相似和肝脏肿瘤形状大小多变等特点,使得快速准确分割出肝脏和肝脏肿瘤仍是一项挑战性的任务。随着深度学习技术在计算机视觉任务中表现优异,在医学图像分割领域得到广泛研究与应用。因此,本文使用深度学习技术来实现肝脏和肝脏
学位
为响应高校对于数据科学课程学习和实践训练的需求,数据科学在线实验平台应运而生。然而,当大量学生同时使用平台进行实验时,如果运维人员无法及时解决出现的资源紧缺、实验耗时长和平台崩溃等性能问题,将严重影响用户使用体验和实验教学进度。目前,各类应用平台的性能瓶颈问题的发现和解决逐渐受到大众的重视。在人工分析具有局限性的情况下,搭建实验平台的监控系统以掌握性能状况显得十分重要。但是大部分的性能监控工具主要
学位
近年来,机器学习算法迅速发展并在众多领域取得成功应用,其中BP神经网络作为经典的前馈神经网络算法,其具有较优的泛化和容错能力、以及非线性映射能力,因此在分类、预测、图像处理和模式识别等领域都取得了不错的成绩。由于BP神经网络工作的核心是BP算法,同时网络对初始时的连接权值和偏置具有极强的依赖性,所以其存在收敛速度慢和易陷入局部最优等问题,进而导致网络的性能受到了严重影响。群智能优化算法具有较强的全
学位
随着电网中业务应用类型越发复杂,多源电网业务信息呈现出容量过大而价值密度低的特点,电网调度业务流程日趋繁琐。在此环境下,传统经验型调度模式工作效率低、协同性不强,难以满足现代电网调度运行需求。因此,提出了基于人工智能技术、依赖电力大数据驱动的调度决策支撑技术,通过智慧人机交互方法智能识别、判断、提取电力关键调度业务信息,并将不同的区域业务汇总于统一的电网智能调度平台。在平台的支撑下,有效简化并解决
期刊
量刑情节是指法院对罪犯审判时,依据的有关罪犯的身份信息与犯罪事实。量刑情节识别任务主要是指利用计算机技术从半结构化的裁判文书中识别出罪犯的量刑情节。作为司法智能化研究中的重要底层任务,识别出来的量刑情节可以为其他司法智能化任务(如:判决预测等)提供信息参考。目前,司法领域数据由于专业性高、逻辑性强,存在标注数据匮乏、标注质量差导致量刑情节识别效果较差的问题。此外,现有量刑情节识别方法研究过于依赖刑
学位
<正>浙江杭州市朝晖幼儿园朝一园区创办于1983年10月,总占地面积3854平方米,户外总面积1892平方米,绿化面积1428平方米。幼儿园被评为浙江省首届现代化幼儿园,浙江省绿色学校,浙江省示范性幼儿园,杭州市特级幼儿园。幼儿园秉承"绿藤悦芽,润泽生长"的理念,追求"让每一个生命在生活中快乐地生长"的发展目标,回归教育本质。近期,幼儿园抓住全面改建的契机,倾听幼儿意见,满足幼儿需求,赋予教育空间
期刊
增强现实技术将虚拟物体与真实场景进行融合,实现两者在光照、几何以及时间方面的一致性,增强使用者对真实场景的感知。同时定位与地图构建(Simultaneous Localization and Mapping,SLAM)是实现增强现实的核心技术之一,该技术通过实时估计传感器位姿来确定其与真实场景的相对位置,从而在真实场景中准确叠加虚拟物体。准确的参数阈值是利用SLAM算法获得精确位姿的关键。然而,目
学位