基于监控视频的异常行为检测方法的研究与实现

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:xub23
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智慧城市建设的发展以及安防摄像头的广泛部署,社会公共安全需求日益增加,人工的视频监控方式已经不能满足需要,利用计算机视觉技术对视频数据进行分析成为了新的研究热点。基于监控视频的人体行为识别技术作为计算机视觉领域的一个基本任务,包括视频中的人体检测,人体姿态估计,人体跟踪以及对时间序列数据的分析与理解等问题。其难点主要在于人体动作的多样性导致行为类别难以定义,数据集难以收集。其次,监控系统中的视频通常存在分辨率低,尺度变化大以及遮挡等问题,对行为识别提出新的挑战。本文以监控视频中的异常行为检测为出发点,基于深度学习技术,研究视频数据中的人体行为识别算法,主要工作与创新点如下:1.提出一种以自我为中心的视频行为识别方法,该方法在空间维度和时序维度对动作特征进行建模分析。在空间维度,提出一种端到端可训练的以实例为中心的空间注意力模块,通过学习人和对象实例的外观特征来突出显示信息区域,对人-物交互的视觉关系进行分析。在时序维度,通过自注意力机制对视频的帧序列进行建模,将特征表示从二维空间域扩展到三维时空域。提出的模型可以在不增加网络参数的同时有效获取视频中的人体动作变化特征,解决视频信息的长时间依赖问题。通过在UCF101数据集中选取涉及人-物交互的动作类别进行实验,实验结果mAP达到97%。与此同时,为了验证模型在实际场景中的异常行为检测能力,以监控视频中使用手机的行为为例对算法进行分析。在算法实现中,创建手机相关的视频行为数据集,手工标注了 7271个视频片段。通过在新创建的数据集上进行实验,模型获得了76%的准确度,对比改进之前的行为识别模型,以自我为中心的行为识别方法获得了16%的提升。另外,本文在实际场景中对模型进行测试,验证了算法的实用性。2.研究了基于骨骼信息的行为识别方法,提出一种多模态数据融合的双流行为识别网络,网络使用关节姿势和RGB信息来提取人体姿势特征和图像外观特征,从而对人体动作序列进行分析。在关节姿势流中,以叠加的关节热图作为输入,将人体姿势编码为一种新的数据格式来分析人体骨骼的运动信息。在RGB信息流中,以原始视频帧作为输入,基于注意力机制建模视频序列中的运动图像随时间变化的关系。模型基于多模态数据对人与物体之间的交互行为进行建模,利用骨骼信息来提高行为识别能力。相较于目前流行的3D卷积网络,提出的模型以2D网络为基础,在降低模型复杂度的同时能够提高网络的性能。在JHMDB数据集上该方法达到了90.6%的精度,对比目前最好的结果,获得了10%左右的提升。在UCF101-24数据集上该方法的准确度与目前最好的方法接近,达到了74.9%,同时其参数量减少了15%左右。
其他文献
假设一量子系统可能是N个状态之一,如何通过量子力学允许的方法来确定这一系统即为所谓的量子态分辨问题。在许多量子计算和量子信息处理过程中,都需要用到量子态分辨。因此,近年来,量子态分辨得到了广泛的研究。另一方面,量子纠缠在量子计算和量子信息中扮演着重要的角色,可以实现经典计算和经典信息论中不能实现的任务。最近的研究认为量子关联是比量子纠缠更广泛的一种量子非局域性,并且能够作为解释某些量子算法加速的原
粒子物理学标准模型(SM)自20世纪60年代末期建立以来在长达40年的实验检验之下,已被证实是一个极其精确的理论。标准模型描述所有已知基本粒子的相互作用,包括物质粒子(三代夸克和轻子)、传递电弱强三种相互作用的规范玻色子、以及产生所有基本粒子质量的Higgs玻色子。然而标准模型仍然遭受一系列基本的理论疑难(例如,无法描述引力作用、精细调节问题、平庸性问题、真空稳定性问题、太多任意参数问题等等),使
近年来,随着人工智能的高速发展,各种智能应用和设备广泛出现,一些传统的生产生活方式被替代,但随之带来的是人工智能安全问题。造假图像和音频的出现、对抗性样本攻击的出现,都对人工智能系统产生巨大的威胁。可信AI,作为目前被广泛关注的研究热点,通过各种防御和容错技术,使得人工智能系统不再轻易被攻击。本论文针对语音方面的攻击手段提出相应的容错方法,提高语音识别系统的鲁棒性。目前语音攻击方法主要有三种,语音
社会对于智能视觉技术的需求越来越强,也推动了计算机视觉技术的高速发展,高速发展的视觉技术也在反哺社会,新时代的社会发展离不开计算机视觉技术。目标检测是计算机视觉技术的一个分支,其已经应用在工业、医学、交通、安全、军事等各个领域,取得了良好的效果。其能够使社会生活更加便利,能够帮助各行各业处理各种视觉任务,节约成本。当前目标检测领域的研究重点集中在提高目标检测技术的检测精度,检测速度以及更简易的部署
随着无线通信技术和人工智能的发展,基于WiFi的室内人员感知已经成为了炙手可热的研究对象。其中活动识别和手势识别应用广泛。由于WiFi信号具有覆盖范围广、普及性高等优点,且其物理层信道状态信息(CSI)对人们的活动和手势感知较为敏感,适合用于室内的人员感知任务。但是WiFi信号存在不稳定、受环境变化影响大的缺陷,从而制约了无线感知的进一步发展和实际应用。因此本文针对环境对无线信号的影响,从应对环境
互联网技术的发展导致网络视频数量激增,也带来了对更可靠、高效的视频处理技术的巨大需求。其中,行为识别作为视频处理的核心任务,受到了越来越大的关注。行为识别算法的性能关键在于对视频空间信息和运动信息的建模能力,然而,目前的行为识别模型往往难以对具有显著变化的复杂时序结构进行建模,从而导致模型的运动信息建模能力不足。因此,研究行为识别模型中的运动信息建模方案具有重要意义。基于上述原因,本文提出了一个基
自然语言处理(NLP)作为人工智能领域的重要分支,其研究的方向十分多。其中生成式任务更是当下的研究热点,因为生成式任务更具挑战性,它主要包括自动文本摘要和机器翻译两个子任务。自动文本摘要即机器从给定的文本中提取整个文本的关键内容。自动文本摘要可以极大地提升人们从海量数据中获取关键信息的效率,除此自动文本摘要还具备为短新闻文本生成标题的用途。当下基于神经网络设计的文本摘要模型都用到了多层编码器,而源
本论文主要研究平均曲率流的自相似解的性质和逆平均曲率流在几何中的应用。欧氏空间中的子流形XMn-Rn+p称为是self-shrinker,如果其平均曲率向量H和位置向量X满足方程其中上表示在法空间上的投影。Self-shrinker不仅源于平均曲率流的自相似解,也描述了平均曲率流的奇点模型,在平均曲率流的研究中有重要地位。本论文第3,4,5章将研究self-shrinker的性质。我们首先证明了任
随着中国经济的发展,城镇化进程的不断加快,为了进一步提高城市交通系统的运输效率,智能交通系统应运而生。为了解决在封闭道路场景下的交通拥堵问题和城市道路场景下的小目标检测和识别问题,本文做了大量理论论证和推导,并提出了相应的方案用来解决不同场景存在的问题。针对封闭道路场景下的智能交通系统,主要需要解决在运行过程中的交通流量不稳定性问题。现有的交通流量控制模型主要针对理想情况下的交通流量进行控制。因而
多项式系统所有孤立解的计算在工程和科学上有着广泛的应用。同伦连续方法近20年来已经成为求解多项式系统全部孤立解的一种可靠而有效的数值算法。由于曲线跟踪的算法和技巧已经比较完善,所以减少跟踪解曲线的数目成为进一步改进这一方法的关键。齐次同伦方法给出了方程组解的个数一个比较紧的上界。在计算上界的过程中遇到了两个问题,这两个问题计算的复杂度本质上都是指数量级的。一是在所有可能的分组中找到相应的m-齐次B