基于图卷积神经网络的人体动作识别研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:aiminis
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体动作识别的主要目标是让机器能够从图像或视频中自动地识别人类的动作行为,其在视频监控、医疗保健、智能家居和人机交互等方面具有广泛的应用前景。人体可以被视为由枢纽关节连接刚性骨骼而成的铰接系统,其动作主要反映在三维空间中的骨架运动上,且骨架信息对尺度、光照和视角等变化具有很强的鲁棒性。因此,基于骨架的动作识别已经成为计算机视觉和模式识别研究领域中一个备受关注的课题。本文针对骨架动作识别任务,结合图模型理论和深度学习方法,围绕骨架数据的鲁棒空间特征提取、时序运动信息建模和动作相关部位捕捉等三个关键问题开展了深入研究。具体而言,本文的主要工作如下:(1)提出了一种受注意力机制启发的图卷积神经网络,可有效提取骨架数据的空间结构特征并捕捉与动作相关的显著运动单元。首先,为了从结构不规则的骨架数据中提取深度特征,利用图将骨架数据进行结构化表示,并引入谱图滤波机制灵活地实现了高效的图卷积运算。其次,为了检测对区分动作具有重要作用的动作单元,设计了新的动作关注层,该层还有助于提取高判别性的特征。最后,为了建模骨架的时序运动模式,使用了递归神经网络单元。如此,构成了一个端到端的深度神经网络模型。(2)提出了一种受自回归滑动平均模型启发的空时图卷积模型,可有效实现对骨架数据中空域结构和时域模式的同时编码。骨架动作识别通常可被视为时序问题,骨架数据中包含的空域和时域相关性应当被有效地建模。为此,设计了多尺度图卷积核以有效编码骨架图的空间结构,同时受启发于擅长处理时序问题的自回归滑动平均模型,设计了时域上递归的图卷积方法。此外,从理论上证明了该模型的稳定性,提供了理论上界,并在实验上分析了图卷积核尺度大小、模型结构等对识别性能的影响。(3)提出了两种结合递归神经网络单元的空时图卷积模型,可对骨架的时序运动模式进行非线性编码。工作(2)中提出的空时图卷积神经网络模型本质上属于线性模型,其性能受到了一定的限制。为了实现复杂的函数逼近,增强模型的拟合能力,本文进一步将其扩展到非线性动态网络上,其中分别采用了长短时记忆和门限递归单元两种递归神经网络的设计思想。所提出的模型不仅继承了局部卷积滤波的成功,而且取得了递归神经网络的序列建模能力,还可以作为基本网络层构建深层网络。针对上述工作中提出的模型,本文在四个公共的骨架动作识别基准数据库上进行了大量的实验,并与其他最先进的模型进行了比较,从而验证了本文提出模型的有效性。与此同时,进一步为当前基于骨架的动作识别指明了更有前景的研究方向。
其他文献
细胞凋亡是受遗传控制的细胞自灭过程,是机体维持稳态的主要机制之一。是一种典形的细胞程序化死亡,细胞程序化死亡的诱导与调控机制是当今生物学中非常活跃的研究领域,涉及到细
植物防卫反应基因的类型、表达、调控和应用何晨阳,王金生(南京农业大学,210014)防卫反应基因是寄生植物中被诱导表达抗病反应的一类基因。早在70年代人们就发现寄主植物抗病性表达需要RNA和
记者赵飞报道:昨日,第七届科学计量学与大学评价国际研讨会暨第二届全国情报学博士生学术论坛在华中师大召开,论坛学术委员会主席、武大中国科学评价研究中心主任邱均平教授在接
一份分析丹麦集中供热系统和零部件公司输出潜力的报告指出,欧洲集中供热预计未来10年会加速发展。集中供热网络在欧洲预计将大幅增长,因为根据COP21协议,欧洲将逐步淘汰化石燃
(1)完整性。它是完全独立的,论文中的基本信息和要点都应该出现在摘要里;}(2)可读性。以通俗易懂的语言来描述可能是复杂的概念和高深的问题;
以琼斯矩阵为数学工具,利用理论分析、计算机仿真和实验研究的方法,考察了偏振片的消光比和预偏角误差对光学电流传感器输出特性的影响.研究结果表明,上述偏振片参量均可在光
分析利用变压吸附技术对爆炸极限范围内的矿井瓦斯气(爆敏浓度瓦斯气)进行提浓的工艺,探讨设备配置、造价,提出爆敏浓度瓦斯气的燃爆抑控措施。
学科核心素养是学科育人价值的集中体现,是学生通过学科学习而逐步形成的正确价值观念、必备品格和关键能力。英语学科核心素养主要包括语言能力、文化意识、思维品质和学习能力(普通高中英语课程标准,2017)。英语核心素养框架已将学习能力视为英语学科核心素养的核心能力。学习能力影响学生获取知识和技能的速度和质量,是学生获得成长与进步的重要能力,对学生的可持续发展具有深刻意义。鉴于学习能力在英语学科核心素养中
灵芝,作为中国传统中药,活性成分丰富,具有很大的研究价值。其中灵芝酸A(GA.A)是一种三萜类化合物,具有抑菌抗癌活性。然而GA.A作为次级代谢产物,产量不高;因其水溶性低,药物利用度也大大降低。因此,本文主要对提高灵芝酸的产量和使用效率方面进行研究。室温常压等离子体(ARTP)诱变是一种新型安全高效的诱变系统,试验采用该系统对灵芝菌株(沪农1号)菌丝体进行诱变处理,根据菌丝表型、长速、随机引物扩
随着半导体产业技术的不断发展,各种各样的半导体材料不断涌现。镓、铟半导体合金作为半导体材料的重要角色,在太阳能电池,光电器件,超高速器件,微波器件等领域都有着广泛的应用。在半导体电子器件中,俄歇复合是影响器件性能的一个重要因素。经研究发现俄歇复合效应会大大限制光电子器件的运行效率与热稳定性,成为光电子器件发展的瓶颈。本论文从半导体的电子能带结构入手,将具有高自旋轨道劈裂能的Bi原子掺杂到镓/铟本征