基于空时特征的视频行为分类技术研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:jeffersonvon
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着4G、5G技术的普及和移动互联网的高速发展,人们信息交互变得更加迅捷。视频逐渐变成了人们生活中不可或缺的一部分,然而随着视频的数量呈指数式增加,如何对视频的内容进行分类、监控以及视频的传播是一个亟待解决的大问题。深度学习在计算机视觉领域取得了丰厚的成果,在目标检测、图片分类等相关的视觉应用场景获得了传统方法完全无法比拟的效果。但是深度学习在视频分类领域上,由于对视频中的行为进行时间和空间维度上的建模存在困难,因此大幅度影响分类准确率。同时,现阶段的模型大部分将光流作为时间维度上的输入,光流的计算速度会大幅度影响模型的速度。针对模型中光流计算速度慢这一问题,提出使用Motion Net模型进行计算光流,并且针对Motion Net的结构提出新的空时特征融合结构,在保证正确率的同时大幅度提升模型速度。针对空间和时间维度的特征融合方式,本文将视频的空间特征和时间特征进行融合,并且将OFF子网络引入传统处理空时特征网络中,将OFF子网络融合到空时特征网络的每一层中,提升模型分类的准确率。同时,将本文提出的网络模型应用到视频行为分类中的一个重要任务——异常行为检测中,并且针对异常行为的特点进行优化提升准确率。本论文所做工作总结如下:(1)从提高模型速度的角度出发,针对现阶段限制模型速度的关键——光流的计算方法,提出使用Motion Net模型代替传统计算光流的方法,将Motion Net网络与传统的光流特征提取网络组成一个端到端的模型。实验结果证明,在保证正确率的前提下,可以大幅度提升模型速度,从原本的14fps提升到140fps;(2)从提高模型的准确率的角度出发,为了充分使用空间特征和时间特征,本论文增加了空时特征融合结构,将Motion Net网络中含有空间信息的特征与时间特征融合,提高了模型的准确率。并且为了从光流中提取更多的时间特征,本文在光流提取特征网络中加入了OFF子网络,将每层特征输入到OFF子网络进一步提取时间特征。最终本文的模型在UCF-101,HMDB51,MSR Daily Activity3D,Florence 3D action等四个数据集上的准确率均达到了顶尖的水平;(3)在异常行为检测中,在原本的空间流和时间流的基础上,为了提高异常行为检测中的微小动作的识别率,本文提出使用DIFF流来提取对应的特征。并且针对其行为特征,本文设计了新的空时特征融合结构,提升网络准确率。最后将多个通道进行加权融合,选取最佳的权重值进行异常行为识别。最终本文的模型在异常行为检测中可以达到98.52%的准确率。
其他文献
《资治通鉴》对惠帝高后年间史事的记载,是尊重历史史实的信史。司马光通过对惠帝高后年间史料的汇编、对不同来源史料的整理与考证,获得了最接近史实的史料,为其编撰惠帝高后年间史事提供了可靠的史料。《通鉴》所载事实大部分与史籍记载一致,且无异议;然仍有部分史事记载值得商榷。一方面,若史籍记载有差异,为使《通鉴》所载史事最大限度的尊重史实,司马光针对具体情况作出相应处理:当史籍记载相左时,通常采用多种史料相
花朵授粉算法是模拟开花植物过程的启发式算法,其特征表现为操作简便、鲁棒性强、搜索速度快、精度高和适用性强,在优化选择领域被广泛应用。但随着处理数据规模的大量增加,存在收敛速度慢、局部深度搜索能力弱、不易跳出局部最优、全局搜索能力弱的问题。针对上述问题,提出一种基于混合蛙跳和中心随机替换的改进花朵授粉算法。首先,改进混合蛙跳算法,通过较好个体的平均值调整最差个体的位置,提高算法的局部深度搜索的能力;
随着智能监控,自动驾驶等计算机视觉应用的普及,图像分类作为这类应用的底层支持,近几年来获得了快速的发展。然而在现实生活及生产活动中,获取的图像大部分都是没有标签的,
随着油气资源勘探开发程度的不断提高,页岩油气资源成为勘探开发的热点,有机质含量是页岩储层测井评价的重要参数,可靠的页岩储层有机质计算方法对页岩油气资源的勘探开发具
函数优化问题广泛的存在于各个工程领域之中,因此对优化算法的研究具有重要的理论意义和现实意义。群智能优化算法是当前优化算法中的研究热点,飞蛾扑火优化(Moth-flame Optimization,MFO)算法作为一种全新的群智能优化算法,渐渐受到学者们的关注。本文针对MFO算法存在的容易出现早熟收敛现象和无法快速收敛的问题,提出一种融合折射原理反向学习的飞蛾扑火优化算法(Moth-flame op
石墨烯将人们的注意力吸引到二维材料领域,加速了对其它二维材料的研究和发现。通过周期表第IV族元素(Si,Ge,Sn)代替石墨烯中的碳(C)原子,人们提出并制备了具有相似结构的蜂窝状
随着无线充电技术的发展,催生出无线可充电传感器网络,该新型网络采用无线充电技术给传感器补充电量,提升传感器整体寿命而获得广泛关注。然而,无线充电技术较高的能量损耗导致在现实中应用困难。为了减少充电资源消耗,提高充电效用,本文研究了两个无线充电器部署优化问题,其主要内容如下:研究面向充电效用最大化的充电器部署优化。该部分求解的问题是给定充电功率预算,和平面上一组传感器,将无线充电器部署在2D平面上,
轮胎磨损产生的细小颗粒物包括橡胶颗粒、炭黑及氧化锌颗粒等,磨掉的橡胶颗粒尺度在几微米至几百微米,而与橡胶结合不好被磨下的炭黑颗粒为纳米尺度,纳米氧化锌颗粒尺寸在1-1
实体关系抽取作为信息抽取的主要任务之一,其目的在于确定无结构文本中两个实体的关系类别,为进一步构建知识图谱、智能问答等应用奠定了理论基础。目前实体关系抽取最常用的
随着互联网的发展,域名系统已经成为了互联网的基础设施。域名系统是一种特殊的名称系统,名称系统本质上是一种映射技术,其维护一种名称域到值域的映射关系,其主要功能是为其