三维骨架信息下的人体动作识别研究

来源 :福州大学 | 被引量 : 0次 | 上传用户:PeNgxionglifanG2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体动作识别通常是指对给定的视频流数据或者三维骨架数据流进行分析并识别出其所代表的动作类型,在体育、人机交互、智能监控等领域上具有广泛的应用前景,目前已经成为计算机视觉领域中的研究热点之一。随着深度采集设备的推广,三维骨架数据直接给出了人体骨架在动作执行过程中随时间变化的三维坐标序列。因此,相较于视频流下的人体动作识别,三维骨架信息下的人体动作识别具有不易受到光照、遮挡以及环境变化等影响的显著优点,具有重要的研究价值。目前深度学习方法在三维骨架信息下的人体动作识别得到了普遍的应用并取得了不错的识别效果。然而,对于大量的相似性动作类型而言,动作执行过程中,关节的运动强度、范围乃至关节间的共现均比较一致,因此识别结果容易出现相似性动作相互混淆的现象。为此,本文以三维骨架信息下的人体动作识别为研究主体,就相似性动作的识别容易混淆的问题展开针对性的研究,在三维骨架信息下的图卷积动作识别模型中,特别引入运动数据流、注意力机制和特征融合的方法,有效改善相似性动作识别互相混淆的情况。首先,考虑到运动流数据蕴含了丰富的动作时序特征,本文以时空人体骨架图为基础,在常见的关节流数据和骨骼流数据之外,特别引入了运动数据流,基于自适应图卷积模块构建了一个三分支图卷积神经网络下的人体动作识别模型,通过关节运动流数据的引入增强时序特征的获取,进而改善相似性动作识别效果。其次,考虑到部分末端效应器的关节和骨骼的运动上通常包含了具有鉴别性的细节特征,本文进一步引入注意力机制,以特别关注鉴别性的关节和骨骼,并增强相应细节特征的作用,从而在相似性动作时序共现一致的情况下,进一步提高识别效果。最后,考虑到关节数据和骨骼数据具有特征互补性,本文引入特征融合策略对关节数据流和骨骼数据流两个特征提取分支进行融合的同时,还特别将运动数据流分支进行数据增强,将运动数据流分解为关节运动数据流和骨骼运动数据流,分别提取特征后进行特征融合,最终构建了双分支特征融合下图卷积神经网络的人体动作识别模型。实验结果验证本文引入的运动数据流、注意力机制和特征融合三种机制,一定程度上可以缓解相似性动作识别相互混淆的现象,有助于提高人体动作识别准确率。
其他文献
薄板在工业领域应用广泛,相比于传统加工,采用激光切割的方法加工薄板具有装夹简单、效率高、精度高等优点,因此激光切割技术被普遍应用于薄板加工。激光切割过程是个复杂的热力耦合过程,传统建模方法难以对激光切割质量进行准确地建模。目前,数据挖掘技术已成为激光切割质量建模的新趋势,但基于数据挖掘的薄板激光切割质量研究还有待深入。为此,本文基于数据挖掘技术对薄板激光切割质量开展了如下研究:(1)为了采集足够的
学位
云存储提供了灵活便捷的数据存储服务,数据拥有者将数据上传到云中存储,以减少数据存储和维护开销。为了保护数据隐私,数据拥有者会将敏感数据加密后外包到云平台存储。但原始数据与密文数据之间就失去了关联性,数据用户将无法使用明文搜索技术对密文进行搜索。可搜索加密是一种直接支持用户在密文数据上进行搜索的技术。为了满足云存储环境中不同用户的密文搜索需求,本文针对现有可搜索加密方案的不足,提出了新的可搜索加密方
学位
镁合金作为一种轻质金属结构材料具有较多的优点,例如高比强度/比刚度、密度小和易回收等,在3C电子、航空航天、汽车和生物医疗等邻域具有广阔的应用前景。然而,镁合金在室温下的塑性变形性能较差,通常需在温热状态下成形,因此研究者在金属板材渐进成形的基础上开发出了各种温/热渐进成形工艺,但不同的加热方式对材料成形性能及零件质量有一定的影响,而目前有关这方面的研究较少。本文以AZ31B镁合金轧制板材作为研究
学位
可分离非线性模型,通常可表示成一系列非线性函数的线性组合形式,这类模型广泛应用于机器学习、系统识别、信号处理、时间序列分析等诸多领域。针对这一特殊结构的非线性模型的参数估计问题,产生了大量以批量数据处理为特点的离线学习算法,如交替的最小二乘(ALS)算法、联合优化(Joint)算法、变量投影(VP)算法等。然而,随着信息技术的快速发展和互联网应用的日益普及,数据的产生速度越来越快及对在线实时估计的
学位
本文以工程机械中润滑油和燃油中易混入水而导致润滑系统和发动机系统失效为背景,基于超润湿材料设计方法,针对工业生产中存在的分层油水和分散油水(乳液),利用金属橡胶设计并制备了两种高效分离油水的超润湿材料,解决传统超润湿材料表面微观形貌易磨损的难题。本文主要进行了以下几点研究:(1)深入研究金属橡胶的制备工艺,推导出金属橡胶孔隙度计算公式,基于平均水力直径模型推导出金属橡胶水力直径。在此基础上,针对工
学位
通常高维数据中蕴含着大量的隐私信息,如果直接发布可能导致隐私的泄露。虽然差分隐私技术能够严格地保护数据的安全,但随着数据属性维度的增加,其产生的时间成本和噪声干扰也将随之增大。尤其是对于高维二值数据很容易被过大的噪声所覆盖。在现有的高维数据差分隐私发布方法中,很少有针对高维二值数据的发布方法,以致于大多都无法很好地解决该类型的隐私发布问题。因此本文结合现有的方法,针对高维二值数据的隐私发布问题展开
学位
受光照条件或相机参数的影响,数码相机通常无法捕获真实场景的完整动态范围,单次曝光拍摄的图像所包含的动态范围与人眼所能感受的动态范围存在巨大差距。对于光照不足的场景或区域,如夜景、昏暗的室内和背光拍摄场景,相机常由于曝光不足而捕获到低光照图像。低光照图像往往色彩暗淡、对比度低且图像细节丢失。对于光照不足的场景或区域,同时捕获低光照图像和正常光照图像是困难甚至不可行的,且低光照图像难以定义与其唯一对应
学位
基于位置的服务利用地理信息为人们的日常出行提供导航服务,服务期间用户不断上传的位置信息形成轨迹大数据。用户轨迹数据的发布可为城市规划、商业决策等提供有力支撑。然而,直接发布未经隐私保护的轨迹数据,恶意攻击推理将对用户的安全、财产等产生严重威胁。因此,常利用差分隐私模型进行轨迹数据发布。该模型通过扰动数据来保护用户隐私。如何在保护隐私的同时兼顾高数据可用性,是轨迹数据安全发布研究中的重要内容。目前差
学位
骨架动作识别是计算机视觉与人工智能的重要研究领域,其通过分析人体骨架运动,从中获得运动特征,根据获得的特征将不同语义的骨架序列进行识别,可用于智能安防、智能医疗、虚拟现实、人机协作等多个领域。近年来,随着深度相机的使用越来越广泛,由此产生了一些3D人体骨架数据集,同时也推动了骨架动作识别研究的发展。但尽管如此,还是会出现在许多特定场景下相关动作缺乏有效数据集的情况。因此,在小样本的条件下对骨架动作
学位
随着互联网和多媒体技术的快速发展,图像已经成为人类信息交流和信息传递过程中不可或缺的一部分,对现代社会的信息存储和信息交互技术等方面的发展具有实际意义。然而,图像的采集、生成、存储以及传输过程中,难免会受到不同类型、不同程度的噪声信号的污染。因而需要对噪声图像进行处理,即从一幅低质量的噪声图像中恢复出高质量的无噪声图像。目前,许多图像去噪的深度学习方法已经被提出,但仍存在去噪结果的细节或纹理损失严
学位