基于深度学习的视频行为识别算法

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:Flying_wind
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来随着通信5G技术以及国内互联网产业的飞速发展,在智能视频监控、自动驾驶汽车、智能家居以及时下兴起的网络短视频等领域每时每刻都在生产海量的视频数据,如何更好地利用计算机理解和识别视频中的行为信息从而为后续更多的决策提供辅助成为了相关行业和计算机视觉领域的一大重要命题。与静态图像相比,视频不仅包含空间场景信息,同时增加了时序上下文信息,这也对视频行为识别算法提出了更大的挑战。本文基于热门的深度学习技术,深入研究和改进了当前主流算法,对视频行为识别中存在的时空尺度问题,即不同的视频不仅在空间维度上可能存在主体尺度大小不同问题,在时间维度上也同样存在的不同持续时间和执行速率的问题,本文结合过去图像领域的一些相关处理方法以及自身进一步的思考,使用了三维卷积核解耦方法先将三维卷积拆分解耦成分别处理空间和时间特征的两个卷积模块,然后进一步地将两个模块进行拓展,提出了一种由并行多尺度卷积核所构成的时空多尺度模块,旨在能够提取包含更丰富尺度信息的特征。接下来本文又探索了一种特征通道、空间以及时间三个域上的注意力机制模块,旨在加强特征在三个域上重要区域的表现,使网络能够更好地训练。在实验部分中我们将多尺度卷积模块和多域注意力模块进行了整体的模块化嵌入到主流的三维卷积网络架构中,并使用了UCF101视频数据集进行了充分的对比实验,本文的算法在不添加多模态光流输入和大型数据集预训练的情况下取得了较优异的表现,最后本文又通过了进一步的实验验证了算法在存在较多时空尺度问题的运动类别视频上精确率相比普通三维卷积网络有较大提升,这也充分验证了本文结构与算法的有效性。
其他文献
研究了受阻酚类、含酯基和亚磷酸酯类防老剂与阴离子活性种的作用,探讨了酚羟基、酯基和亚磷酸酯与活性种的反应机理.受阻酚类防老剂上的酚羟基可提供活泼氢使阴离子活性种失
民国时期债务纠纷已经普遍存在,至国民政府时期,立法机关通过制定民法典规范了既往民事随民俗的传统模式,民法债编尽可能在债务纠纷产生的环节都加以法律设计,并且随着民法的
10kV配电线路是电力系统与用户直接相连的环节,其线路长、设备数量多、负荷分散、运行中要承受机械和电气负荷及各种天气因素的影响,故障几率较大。为保证10kV配电线路的安全稳
上一节谈到解图形运动问题的关键是用含自变量x的代数式表示出有关的量,本节通过例题的分析介绍怎样准确地写出代数式.
期刊
英语绘本是英语课堂上常用的一种教学资源。教师通过对英语绘本的故事内容、语言表达、思想情感的关注,恰当合理地借助绘本开展教学活动,能最大程度发挥绘本的教育价值。
主要阐述水情自动化采集系统在灌区管理中的应用,介绍了安徽省淠史杭灌区水情采集系统的目标任务、构成、原理、功能、实现方法以及发挥的作用等,该系统的建设为实现灌区管理的
辽椒四号是辣椒新杂种一代,由辽宁省农科院园艺所育成,现已推广1333hm2以上,于1990年6月通过省级审定。 选育经过 自1978年以来,从地方品种柿子椒3号中选出了自选系3号,其特
我国煤系高岭土储量远比非煤系高岭土丰富,在我国具有得天独厚的资源优势。煤系高岭土主要伴随煤矿的开采所堆积废弃,原料利用率低,容易造成资源浪费。目前高岭土主要的应用
突发通信系统(Burst Communication System,BCS)将信号设计为短时突发的形式,在时变信道中能够进行可靠的数据传输。随着电磁环境日益复杂,干扰设备和侦察设备能力日益增强,