基于时空语义特征的人体运动行为识别研究与实现

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:liang__fei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网技术的发展导致网络视频数量激增,也带来了对更可靠、高效的视频处理技术的巨大需求。其中,行为识别作为视频处理的核心任务,受到了越来越大的关注。行为识别算法的性能关键在于对视频空间信息和运动信息的建模能力,然而,目前的行为识别模型往往难以对具有显著变化的复杂时序结构进行建模,从而导致模型的运动信息建模能力不足。因此,研究行为识别模型中的运动信息建模方案具有重要意义。基于上述原因,本文提出了一个基于时空语义特征的人体运动行为识别方法,具体研究内容如下:(1)提出基于通道注意力的运动特征增强方法。针对现有双流网络行为识别方法存在时效性差以及空间特征与运动特征交互不足的问题,本方法通过空间特征和运动特征的联合学习避免了光流输入的额外开销,同时本方法通过通道注意力机制和残差连接将得到的运动特征再作用于空间特征,增强其中的运动敏感部分,实现了空间信息和运动信息的特征级交互。(2)提出级联的长时域运动特征集成方法。针对现有3D卷积神经网络行为识别方法存在网络过深难以优化以及大量局部卷积操作远导致远距离帧间相互作用不足的问题,本方法通过层次化的残差网络结构和自适应的帧序重构模块,避免了网络的退化,增加了远距离帧在网络中的交互频率,实现了了大范围的长时序关联建模。(3)完成基于生活场景的行为识别系统。为验证算法实用性,结合实际场景需求,设计并实现了基于生活场景的行为识别系统,实现了生活场景下的视频行为分类。
其他文献
本文研究一类奇异微分方程和一类全非线性奇异椭圆方程的正则性问题。第一部分我们研究的是一类奇异微分方程。首先我们运用比较原理和伸缩论证得到方程解的增长性估计和解在边界点附近的性质;然后我们引入了一个迭代,运用这个迭代和归纳法我们得到了方程解的正则性估计;最后把我们的论证方法推广到了一类含参奇异微分方程,并得到相应的正则性结论。第二部分我们把第一部分得到的奇异微分方程和含参奇异微分方程解的正则性理论分
随着人们对海洋资源与开发的日益重视,成像声纳不断发展,包含的数据量急剧增加,同时由于水下环境的错综复杂导致声纳图像受到多种不同类型复杂严重的噪声影响,优秀的声纳图像去噪算法计算复杂、耗时长,难以满足应用场合的实时性要求。而GPU具有大量计算单元,在大规模数据计算、处理速度等方面的性能大大超过CPU,表现出巨大的优势和潜力,利用GPU来进行声纳图像去噪并行加速研究,具备良好的可行性和工程应用价值,可
有机硅改性聚氨酯胶粘剂能够结合二者的性能优势,利用有机硅提高聚氨酯的耐水、耐热和耐候等性能。本文综述了聚氨酯胶粘剂的各种类型、有机硅改性聚氨酯胶粘剂的方法和研究进展,包括硅烷偶联剂和硅氧烷低聚物两种改性方法,并对比了不同有机硅改性的优缺点。
近年来,随着信息化时代的飞速推进,各行业涉及到的数据越来越复杂,数据规模也越来越大,比如超清彩图,视频,交通信息,遥感数据等。对于这些高维数据,我们将其称为张量。然而,在张量的采集传输过程中,受到各方面因素的影响,数据丢失问题不可避免。如何从已知数据推测出未知部分的信息对于后续应用至关重要。这个任务我们称之为张量补全。由于现实世界中,大部分数据都是低秩的,这个问题也被称为低秩张量补全。本文主要研究
近年来,围绕飞行器的应用方式越来越丰富,其应用领域更多,任务也更繁杂,单一飞行器已不足以供应所有需求。飞行器集群化可以满足扩张后的作业需求,提供更加复杂的功能服务,集群作业依赖精确及时的导航定位,因此迫切需要研究与设计高性能的集群协同导航系统。目前该技术研究仍在萌芽期,研究大多仅考虑到集群化数量、导航精度、定位成本以及自主性等方面中的一两个,没有给出一个较全面的统一通用的集群协同导航方法和仿真环境
假设一量子系统可能是N个状态之一,如何通过量子力学允许的方法来确定这一系统即为所谓的量子态分辨问题。在许多量子计算和量子信息处理过程中,都需要用到量子态分辨。因此,近年来,量子态分辨得到了广泛的研究。另一方面,量子纠缠在量子计算和量子信息中扮演着重要的角色,可以实现经典计算和经典信息论中不能实现的任务。最近的研究认为量子关联是比量子纠缠更广泛的一种量子非局域性,并且能够作为解释某些量子算法加速的原
粒子物理学标准模型(SM)自20世纪60年代末期建立以来在长达40年的实验检验之下,已被证实是一个极其精确的理论。标准模型描述所有已知基本粒子的相互作用,包括物质粒子(三代夸克和轻子)、传递电弱强三种相互作用的规范玻色子、以及产生所有基本粒子质量的Higgs玻色子。然而标准模型仍然遭受一系列基本的理论疑难(例如,无法描述引力作用、精细调节问题、平庸性问题、真空稳定性问题、太多任意参数问题等等),使
近年来,随着人工智能的高速发展,各种智能应用和设备广泛出现,一些传统的生产生活方式被替代,但随之带来的是人工智能安全问题。造假图像和音频的出现、对抗性样本攻击的出现,都对人工智能系统产生巨大的威胁。可信AI,作为目前被广泛关注的研究热点,通过各种防御和容错技术,使得人工智能系统不再轻易被攻击。本论文针对语音方面的攻击手段提出相应的容错方法,提高语音识别系统的鲁棒性。目前语音攻击方法主要有三种,语音
社会对于智能视觉技术的需求越来越强,也推动了计算机视觉技术的高速发展,高速发展的视觉技术也在反哺社会,新时代的社会发展离不开计算机视觉技术。目标检测是计算机视觉技术的一个分支,其已经应用在工业、医学、交通、安全、军事等各个领域,取得了良好的效果。其能够使社会生活更加便利,能够帮助各行各业处理各种视觉任务,节约成本。当前目标检测领域的研究重点集中在提高目标检测技术的检测精度,检测速度以及更简易的部署
随着无线通信技术和人工智能的发展,基于WiFi的室内人员感知已经成为了炙手可热的研究对象。其中活动识别和手势识别应用广泛。由于WiFi信号具有覆盖范围广、普及性高等优点,且其物理层信道状态信息(CSI)对人们的活动和手势感知较为敏感,适合用于室内的人员感知任务。但是WiFi信号存在不稳定、受环境变化影响大的缺陷,从而制约了无线感知的进一步发展和实际应用。因此本文针对环境对无线信号的影响,从应对环境