基于特征融合的3D骨架动作识别算法研究

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:SB502
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
动作识别在诸如智能安防、人机交互、无人驾驶等应用领域具有关键作用。很长一段时间,RGB图像都是动作识别的信息来源。随着深度相机的出现以及深度图像估测技术的发展,动作识别中出现了新的分支,即3D骨架动作识别。3D骨架关节点数据是在深度图像的基础之上通过估测技术得到的,具有光照变化不敏感的特性。同时,估测技术能够依据人体骨骼结构估算出被遮挡住的人体关节点的空间位置。这样,依赖RGB图像的动作识别存在的自遮挡问题在一定程度上得到了缓解。由于上述的一些优势,众多学者投入到基于3D骨架动作识别的研究中。在最近的几年中,经过研究者们的努力,许多基于3D骨架节点的动作识别方法被提出来。其中大部分方法使用的是描述姿态的帧级特征。而这些特征本身描述能力不够强,鲁棒性不足,而且没有捕获足够的帧间运动信息。因此,基于这些帧级特征的动作识别方法在实验结果上还有较大的提升空间。另外,动态时间规整在很多识别框架中依旧是处理动作序列匹配的首选方法。但是,动态时间规整对于处理动作异步和动作重复的问题效果不佳。基于上述情况,本文首先分析了3D骨架动作识别的研究现状,接着使用特征融合的方法进行骨骼动作识别,以期获得更高的识别率。本文的工作主要概括为下列三个内容:(1)本文提出了一种MCTD特征。本文使用特殊欧式群SE(3)作为特征,描述旋转和平移构成的运动特征,然后融合坐标和帧时间来定位运动特征的空间和时间维度上的分布,得到MCTD(Motion-Coordinate-Time Descriptor)特征。这种特征很好地捕获了动作序列的运动信息,具有较强的描述性。(2)本文提出了基于MCTD特征的动作识别方法框架。首先提取MCTD特征,接着通过特定的MSCK核函数计算不同动作序列的相似距离。该MSCK核逐个比较对应骨骼段的MCTD特征。本文在计算过程中使用高阶共生池化方法,挖掘出动作特征的高阶自相关统计量,解决了动作时间长短不匹配和动作重复的问题。(3)本文为了弥补空间上信息的缺失,提出了基于空间相对距离的空间匹配方法。对于不同的动作,参与执行的骨骼部位是不同的。本文计算相对空间距离,通过选取Top-k的关节点对,挖掘出参与动作执行的骨骼部位组合。接着将这些关节点进行匹配,获得空间匹配描述子(space-pairwise-descriptor,SPD)。然后将相对空间距离作为姿态特征,进行后期融合的操作。最后本文将上述方法运用在相同的三个公共数据集上进行实验,并与现有的动作识别方法进行对比。结果表明本文所提出方法的可行性和有效性。
其他文献
菊花题材,是中国传统绘画题材“四君子”中经典的一类,是我国传统绘画的精华。从古到今,人们对“四君子”绘画题材的研究成果非常多,可以找到的资料文献数量也比较可观。然而总观这些研究,单对于菊花题材丰富的艺术语言以及审美价值等方面的研究却比较少,且缺乏对于菊花题材发展的系统论述和其相关画谱和画法以及代表性画家的研究,这使得菊花题材具有很大的潜力可以去进行思考、发挥和创作。一方面,对菊花题材的创作研究可以
肋环形加劲浅球壳是一种薄壳和加劲肋共同承载的空间结构形式。因其具有良好的受力性能和经济性,广泛应用于大型储气罐的顶盖和活塞结构。由于此类结构的理论研究不足,给工程设计带来一定困难。本文采用数值分析、模型试验和理论研究相结合的方法,探讨大型肋环形加劲浅球壳的静力承载性能。先基于弹性地基梁比拟法提出经向肋的位移和内力计算式;再设计加工3个缩尺试验模型,并通过静载试验结果分析加劲浅球壳的受力性能;最后考
南方电网在长期的网架规划过程中提出了将云南电网作为一个单独的送端电网,与南方主网实行异步联网的运行方式,云南电网丰富的水电资源通过7回直流线路送出,提升了云南电网的外送能力,极大程度降低了原有同步电网运行状态下系统因直流换相失败或闭锁等因素引发的系统失稳的风险。为了检验实施异步连接后我国电网运行的安全稳定性,2016年南方电网公司针对异步联网后的系统进行了整体性的试验,在试验的过程中云南电网内部曾
本文首先介绍了结构损伤识别领域的国内外研究背景以及研究现状,综述了一些常用的结构损伤识别方法,在此基础上,提出了使用响应协方差参数作为损伤指标,并分别使用应变响应和加速度响应来进行损伤识别,由此得到两种损伤识别指标,第一种是应变响应协方差参数(Co S),第二种是加速度响应不同频带的协方差参数(Co I),通过比较结构损伤前和后的Co S或Co I就可进行损伤识别,无需结构分析模型,直接从测量的应
自动驾驶技术已成为智能交通发展的趋势,在自动驾驶环境下,基于车-车、车-路之间的双向信息交互,交叉口可无需信号灯控制,自动驾驶车辆之间能相互协调、相互穿插地通过交叉口。因此,如何设计安全、高效的面向自动驾驶车辆通行的交叉口通行模式和管控模型,已成为当前的研究热点。本文针对自动驾驶环境下的交叉口通行模式和控制方法进行研究,主要完成以下几方面的工作:(1)自动驾驶环境下交叉口通行模式基础问题研究。首先
随着CT设备探测器宽度增加,CT检查功能逐渐拓展,CT使用频率迅速增长,患者受到的辐照剂量不断增大。CT球管在扫描区域外的散漏射线,检查床、周边墙面和物体的反射线以及人体组
随着我国城镇化的快速发展,城市地面交通压力也与日俱增,地铁因其不占用地面交通资源,且速度快、效率高等特点,受到政府、专业人士及广大民众的一致青睐。但地铁内部结构复杂
光伏发电已成为太阳能大规模开发利用的重要途径,由于发电过程清洁无害、安全便利、维护简单,光伏发电并网运行成为国内外高度重视的技术发展方向之一。然而,光伏电池受天气变化、阴影遮挡、不同规格或新旧电池混合使用等因素的影响,易造成光伏器件对光照强度与环境温度的反应不一致,这种情况通常称之为失配现象。失配问题不仅导致阵列输出功率严重降低,而且会引起热斑效应损坏组件,严重影响组件的使用寿命和发电效率。本文基
隐喻是一种重要语言现象,备受学者关注。自从韩礼德在《功能语法导论》中提出“语法隐喻”以来,语言学家们便对语法隐喻进行了深入的探索及研究。根据语言的元功能,韩礼德将其分为概念语法隐喻和人际语法隐喻。后来,马丁补充且完善了韩礼德的理论,于1992年提出语篇语法隐喻。然而,此次提出并没有引起学者们的大范围研究。本文以系统功能语法为框架,应用语言的元功能理论以及韩礼德和马丁的语法隐喻理论,对普利策新闻语篇
雅虎财经新闻网作为美国最具有影响力的财经网站之一,涉及股票报价、股票汇率、公司新闻稿等金融内容,是人们了解国内外财经知识的首选网站。由于雅虎财经新闻更新速度快,消息准确,为企业和国家的经济建设提供了良好的参考价值。笔者在阅读财经新闻过程中发现,被动语态使用频繁并且翻译难度大。如果不能准确的翻译被动语态,很容易对文章内容产生疑惑。因此,本篇论文将在目的论的指导下完成被动句的翻译实践。本次论文的翻译原