基于注意力机制的行为识别方法

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:hyz012
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息时代的发展,视频数据在日常生活和工作中大量涌现,视频中的人体行为识别也具有巨大的应用价值,涉及智能监控、人机交互和自动驾驶等多个领域,是智能化产业发展的重要任务之一。视频中的人体行为是时间和空间上的动态变化,有效提取行为的时空特征是解决问题的关键。近年来,基于深度学习的行为识别研究发展迅猛,网络结构不断革新,数据形式也涉及骨架、RGB和深度图等多种模态,取得了卓越的成就。目前的行为识别方法大多依靠大数据和高性能计算技术,而复杂场景下识别性能的进一步提升离不开人类思维的指导,其中视觉注意力是适合网络应用的机制之一,注意力机制可以帮助网络高效地提取数据中关键信息。此外,针对不同的数据和任务,应设计相契合的注意力机制,帮助提升网络性能。因此本文在骨架数据和RGB数据上,结合相应的任务,分别设计基于注意力机制的行为识别方法,增强关键信息学习,达到了较高的识别准确率。本文的主要工作包括以下两点:首先,在骨架数据模态下,本文提出一种基于引导注意力的双人交互行为识别方法。骨架数据具有轻量、干扰少的特点,被广泛用于行为识别任务中,但是处理双人交互行为时,仍然存在较多冗余信息,现有方法大多不能有效提取交互特征。针对这一问题,本文提出一种引导注意力下的图卷积网络,用于骨架双人交互识别。该网络以人类的观察经验作为先验知识,设计交互行为的骨架图结构,建立可能产生交互的部位连接关系。以这种预设的双人关系作为注意力,约束图卷积的学习,实现知识引导下的特征提取。实验表明本文提出的方法极大提升了双人交互行为的识别准确率。其次,在RGB视频模态下,本文提出一种基于时空注意力的行为识别方法。RGB视频是广泛存在的数据形式,但其在空间和时间上均存在大量的背景信息,人体行为一般只发生于空间中的局部区域,并且时间上也具备不同的重要性。针对这一问题,本文提出了一种基于时空注意力的行为识别网络,通过设计伪3D卷积中的注意力机制,实现对时空重要信息的增强。在空间维度上,该网络自动定位判别性区域,从中学习行为的关键信息,并综合全局区域的信息进行判断。在时间维度上,设计时间注意力模块自适应计算特征重要性,对重要时刻的特征进行增强。空间注意力和时间注意力在网络中统一搭建,协同增强时空关键信息,可以大幅提升行为识别效果。综上所述,本文主要研究基于注意力机制的行为识别方法,针对不同的数据和任务特点,结合人类视觉的行为分析方式,设计相应的注意力网络,提升特征学习能力,在骨架数据和RGB数据任务上均取得了很好的识别结果。
其他文献
金刚石线锯切割技术是用于硬脆材料切割加工的新兴技术,可广泛用于单晶硅的切片工序,具有切割效率高、切片损耗小、切片精度高等优点。切片是把硅棒变成硅片的一个重要工序,硅片质量的好坏直接影响着后续的加工成本。为了进一步降低成本,提高切片表面质量,尝试将微量润滑技术应用于线锯切割中,前期预研实验表明微量润滑技术能提高线锯切割效率,降低切片表面粗糙度。因此有必要对微量润滑线锯切割进行深入研究。为进一步分析微
随着信息技术的飞速发展,人们获取信息的途径逐渐从二维图像发展到视频序列。作为视频序列处理的一个分支,目标跟踪在军事、工业及民用领域都具有较大的应用价值。视频目标跟踪相对于其他计算机视觉任务而言,其场景更加复杂,面临的挑战更多,且需满足精度和实时性的双重需求。传统的目标跟踪方法往往因为处理场景简单、精度低、实时性差,使得其实际应用受到了较大的限制。近年来,基于深度学习的目标跟踪技术由于其良好的性能,
随着现代室内装饰行业的发展及人们对环境健康的重视,人们对于室内装饰材料的环保性要求越来越高,然而竹木质装饰材料常用的含醛胶黏剂在长期使用过程中受外界环境影响或者因
在信息技术和网络通信高速发展的今天,人们在享受网络给自己带来的便利的同时,也在承担着网络上各种攻击造成的隐私泄露、数据丢失和经济损失等风险。由于网络架构的静态性、确定性等因素,难以应对日渐复杂化的网络攻击。为了改变这种局面,世界各国相继展开主动防御研究,网络欺骗这种通过隐藏对象真实信息的技术逐渐兴起。本文依托网络空间拟态防御技术和软件定义网络,将动态传输路径和主机标识结合起来,研究多维属性共同跳变
负热膨胀(Negative Thermal Expansion)是一种随温度升高而体积收缩的反常物理现象,在功能性材料、器件设计等领域具有广泛应用前景。近二十年来对负热膨胀的研究得到很大发
根据十九大及各部门的政策指导,国家对农业、旅游业以及第一、二、三产业的融合发展十分重视。大力推进农业与旅游业融合发展既符合国家政府政策的引导,又能大力推动产业自身的创新与发展,从而实现经济增长、社会进步、生态和谐。长期以来,悦来镇的主导产业是工业,农业与旅游业发展慢且产值低,严重影响了其由规模大镇向经济强镇的转变。努力建设“富强、美丽、平安、幸福”新悦来,农旅融合发展成为政府实现悦来镇工作总目标的
供电服务作为与国计民生密切相关的工作备受社会关注,随着社会公众对供电水平期望值的提升,作为供电服务末端的供电延伸服务工作的研究也引起社会的日益关注,但是国内对供电
由于化学物质泄漏和溢油造成的水污染事件频繁发生,油水分离受到了广泛的关注。水中的油类和有机污染物会导致水中溶解氧的减少,严重影响水生生物的正常生长,进而破坏水资源;
在现代社会,互联网在日常生活中发挥着越来越重要的作用,正在给人们的交流、商业模式甚至日常生活带来翻天覆地的变化,DDoS(分布式拒绝服务)攻击已然成为网络面临的主要威胁之一。多年来,DDoS攻击不断发展和演变,网络层和传输层的防御的能力也变得越来越强大,攻击者的攻击目标转向应用层。文献[1]指出,应用层基于HTTP协议的DDoS攻击数年来一直呈上升趋势,复杂性也随之而增长,因此针对HTTP-DDo
浅浮雕是一种在平面上表现三维物体细节的艺术品,利用压缩的方法对三维物体进行处理,是一种雕塑和绘画结合的产物。目前,传统的浅浮雕建模算法主要存在如下问题:浅浮雕生成效率较低;3D模型的顶点数限制浅浮雕建模质量;浅浮雕风格化算法流程较为复杂。近年来,深度学习技术飞速发展,在图像处理领域的许多方面取得了突破性的成绩。而浅浮雕模型本质上是一种2.5D的高度图,因此,利用深度学习技术解决当前浅浮雕建模中存在