基于时序上下文增强和图卷积的视频异常事件识别

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:netfate
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着监控摄像头的大量铺设和无死角覆盖,每时每刻都可以产生海量的视频监控数据,许多在公共区域发生的异常或危险行为都能够被捕捉并记录。使用人力难以对海量的视频监控数据进行长时间观察,因此研究利用人工智能算法自动对视频监控中的内容进行分析,识别出视频监控中的有效信息,具有重要的理论价值和实际意义。针对监控视频中的异常事件识别问题,提出基于时序上下文增强和多流双头图卷积的异常事件识别模型。该模型包含异常事件检测阶段和异常事件分类阶段。在异常事件检测阶段,为了改善异常视频中大量正常片段特征导致异常片段特征表现不明显的问题,设计多尺度局部时序上下文编码器和全局时序上下文编码器,捕获特征的局部和全局时序依赖关系,形成鲁棒的时空特征。为了使异常事件检测阶段的预测分数更接近真实值,在多示例排名模型的基础上,融入注意力机制,形成基于注意力机制的多示例排名模型。改进多示例排名模型使用最大预测分数计算损失的方法,采用多元联合损失函数,使特征具有类内紧凑性和类间可分性。在异常事件分类阶段,为避免计算资源浪费,同时凸显异常事件,通过异常特征抽取算法抽取关键特征用于异常事件分类。针对抽取的不连续的异常特征,借鉴多头思想,采用多流双头图卷积网络充分挖掘特征间的联系。该网络利用特征相似性,时间一致性和异常分数相似性从多角度聚合特征,提高异常事件分类精度。分别对异常事件检测阶段和异常事件分类阶段在UCF-Crime数据集上进行实验。异常事件检测结果与2018年Sultani等人提出的方法相比AUC值高9.35%,与2021年的Tian等人提出的方法相比AUC值高0.43%。异常事件分类结果与Ramna等人提出的方法相比,平均准确率高7.13%。实验结果表明了所提出的异常事件识别方法的有效性。
其他文献
联邦学习从客户端丰富且高度隐私敏感的训练数据中学习共享模型,数据模型在中心与客户端间传递并迭代训练,这导致常规的联邦学习必须面临客户端数据的非独立同分布(Not Independent and Identical Distributed,Non-IID)问题和安全性问题。联邦学习存在的另一个问题是对有标签数据的依赖性,但在实际应用过程中算法需要从无标签的用户数据中尽可能地挖掘信息。为了解决以上问题
学位
随着大数据时代的来临,应用服务中充斥着海量信息,使得用户难以从中有效的挖掘出所需的高质量信息。而推荐系统则可以有效的解决“信息超载”问题,依据用户的喜好,为其精准的推荐感兴趣的潜在商品信息。然而现有的推荐算法普遍存在以下两个问题:1)数据稀疏问题;2)没有利用辅助侧信息且未对多源异构和高阶多维的非线性信息进行统一建模。鉴于此,本文结合张量分解和张量神经网络,设计了高效精准的混合推荐算法。首先,提出
学位
压缩感知(Compressed Sensing,CS)理论指出:信号只需满足可压缩或在一个特定域中有一定稀疏性,便可以通过和稀疏基不相关的观测矩阵进行线性观测,并通过算法重构得到初始信号。先验信息是指主体在观察该事物之前已经具有的关于该事物的信息,其在在信号重构中至关重要。目前CS重构算法大多只考虑图像的单个先验信息,如非局部低秩,先验正则等,对于不同图像重构的效果波动很大,抗噪能力也不强。且非局
学位
芯片诊断是一种基于诊断工具分析不合格芯片的测试数据、电路网表以及电路响应的过程,用于对其中的真实故障进行定位。芯片诊断分辨率反映了芯片诊断结果的精确程度,较高的诊断分辨率能极大地节省后续物理失效分析的成本,有助于发掘集成电路出现故障的问题根源,进而达到改善芯片生产工艺、提高芯片生产良率、降低生产成本的目的。芯片诊断的输出是一组疑似故障位点及其邻域上的状态,电路中的故障与其邻域有着密切的联系。现有的
学位
人机物三元空间智能融合成为时代发展的新浪潮,如何有效处理和利用由人机物之间频繁交互而产生的大量高阶高维数据,是促进人机物智能快速发展所面临的重大挑战。传统深度学习算法经过多年发展,在对象检测、目标跟踪等领域取得了巨大的成功,而随着其与人机物智能的深度结合,传统深度学习面临的问题愈加凸显:第一,其大都是在向量空间中对数据进行表征和处理,在对信息-物理-社会系统中产生的高阶高维数据建模时,会破坏数据的
学位
布尔可满足性问题是计算机科学领域中一个十分重要的问题。它是第一个被证明为NP完全的问题,自提出以来,就得到了广泛的研究。许多著名的NP完全问题经常转化为布尔可满足性问题进行求解。另外,该问题在人工智能、形式验证以及电路设计等多个学科领域均有着实际的应用价值。目前,布尔可满足性问题的现代求解算法能够在可接受的时间内求解大规模算例并且可以取得高质量的求解方案。但算法依靠专家经验根据不同的算例特征设置相
学位
伴随着医疗数据的不断增长以及医疗智能的持续发展,医疗数据的潜在信息与价值对公共健康领域的影响越来越大,例如新冠胸透数据在不同区域不断呈现出新的病症变异特征,这直接影响诊断判别标准。但是由于胸透数据蕴含患者的个人信息,具有高隐私性与高保密性,无法大范围共享。在这样的背景下,医疗数据的信息挖掘与共享的过程显得异常艰难。近年来联邦学习作为高效的、支持多机构参与的分布式计算框架,用户可以通过共享梯度来学习
学位
在存算分离型数据库管理系统中,重做日志(redo log)在计算层和存储层的数据一致性上起到了关键作用。重做日志写入缓冲区和重做日志持久化是重做日志处理过程中比较重要的两个环节。因此,对这两个环节进行优化可以提高系统性能、简化节点之间的合作逻辑,使系统能更好的面对高并发、高连接且易于维护。针对存算分离型数据库管理系统在重做日志缓冲区结构、锁机制、线程调度和网络通信等方面的不足之处,给出了改进优化方
学位
脑胶质瘤为最常见的颅内恶性肿瘤,临床需要从T1、T1ce、T2、FLAIR四个模态的磁共振图像中分割并区分出包含坏死核心、增强核心、周围水肿的肿瘤区域。目前基于深度学习的多标签分割算法有较好的效果,但需要大量带注释的数据集参与网络训练。针对现有的脑胶质瘤数据集较小的问题,使用生成对抗网络(Generative Adversarial Nets,GAN)的方式生成数据以扩充数据集。脑胶质瘤影像对图像
学位
图模式匹配在图挖掘中是一类具有挑战性的问题。首先,模式图中顶点或边的搜索顺序与性能密切相关,不同的搜索顺序可能会导致最后的执行时间相差几个数量级,其次,由于模式图普遍存在对称结构,对称结构在模式匹配的过程中会不可避免地映射到同一组嵌入,从而引发了冗余计算,这还会导致最终匹配结果中存在自同构,最后,在枚举子图的过程中,中间子图规模,计算量呈指数级别增长,系统的内存消耗往往很大。为解决以上问题,单机图
学位