基于深度学习的视频行为识别方法研究

来源 :山西大学 | 被引量 : 0次 | 上传用户:ynkm8899
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着智慧城市建设的推进,人们对安防领域也有了更高的需求,对视频中的行为进行识别越来越成为重要的研究方向。传统的视频行为识别方法中,需要手工设计特征,而基于深度学习的视频行为识别方法则可以让计算机自动学习出有用的特征。除了智能安防领域外,视频行为识别技术也广泛应用于人机交互游戏、医疗看护、行为再识别等领域。在当前大多数基于深度学习的视频行为识别方法中,均同等对待网络提取的特征,在识别过程中没有关注对识别结果起重要作用的特征,论文提出将计算机视觉领域的两种注意力机制引入,搭建了两种视频行为识别网络。论文构建了基于压缩奖惩机制的视频行为识别网络。网络以时间分段网络为基本框架,时间分段网络中的时间与空间网络均将基于压缩奖惩机制的残差网络作为基本网络,通过压缩与奖惩操作,在通道维度上对网络提取到的特征进行加权,赋予特征不同权重以提高识别准确率。时间分段网络首先将视频平均分为三段,从每段提取堆叠光流与RGB视频帧分别作为时间与空间网络的输入,并对视频行为作出初步预测,然后融合每个片段的时间与空间网络的预测结果得到视频级的时间与空间网络预测,最后融合时空网络的视频级预测结果得到最终的分类结果。基于压缩奖惩机制的视频行为识别网络训练时,首先在大规模数据集ImageNet上预训练基于压缩奖惩机制的空间网络,然后采用跨模态训练方法预训练基于压缩奖惩机制的时间网络,最后将预训练好的时间与空间网络参数作为初始值训练基于压缩奖惩机制的时间与空间网络,融合时空网络的预测结果得到最终的分类结果。在UCF101与HMDB51数据集上进行了实验,结果表明识别准确率获得了提高。论文构建了基于卷积注意模块的视频行为识别网络。网络以时间分段网络为基本框架,为了更符合人类对视频行为的识别与理解,时间分段网络中的时间与空间网络采用不同的网络结构。时间网络采用基于卷积注意模块的BN-GoogleNet作为基础网络,空间网络采用基于卷积注意模块的残差网络作为基础网络。通过卷积注意模块,在通道与空间维度上对网络提取的特征进行加权,赋予特征不同权重以提高识别准确率。网络预训练策略与基于压缩奖惩机制的视频行为识别网络的预训练策略相同。在UCF101与HMDB51数据集上进行了实验,结果表明识别准确率获得了提高。
其他文献
为给葱的染色体的识别提供新标记,建立葱的分子细胞遗传学核型,本研究采用去壁火焰干燥法制备了分散且形态良好的葱中期染色体,并进行了CPD(PI和DAPI组合)染色和45SrDNA荧光原
传统农业知识服务系统缺乏语义支持,并且在农业领域应用极为不足,本研究提出利用本体论和语义网知识建立知识服务系统的必要性。以茶叶领域为例,分析了生产过程中各类用户的
临床资料50例中,男30例,女20例;年龄最小者32岁,最大者61岁,以40~55岁居多;病程1年以下者22例,2至3年20例,3至5年8例;伴上消化道出血者8例;伴发轻度肝昏迷者5例;住院治疗者18
通过对引进的11-07、16-08、Y1和SCZ4个紫色甘薯品种分别在云南省玉溪市3个不同海拔的山地种植,分析其生物学特性、丰产性、品质等指标。结果表明:在海拔2000m以上,以11-07和S
"5.12"汶川特大地震使农业社会化服务体系遭受了巨大损失,严重阻碍了农业科技成果的示范转化和扩散推广。以四川省为例,通过调查和实践,分析了农业社会化服务体系灾前概况和灾
期刊
笔者自1998年以来,采用中药内服配合理疗治疗产后尿潴留118例,疗效显著,现介绍如下。一般资料年龄20~38岁;病程最短1/2d,最长5d,第二产程延长者有99例,无延长者19例。治疗方法1内服补
以3,3-二硝基氮杂环丁烷(DNAZ)含能单体分别与光气及草酰氯反应,制得了两种多硝基化合物。经元素分析及红外,核磁共振光谱鉴定了它们的结构,并用DSC法测定了它们的热分解的动力学参数。还用SCF-MO-AMI方
目的:研究地黄膝龙颗粒对骨性关节炎家兔血清、关节软骨中MDA的影响和组织学变化,探讨其治疗OA的机制.方法:将40只日本大耳白兔随机分为正常组(A)模型组(B)布络芬组(C)地黄膝龙组(D)据H
随着全球经济的飞速发展,世界不同地区均经历了一定程度的雾霾污染,其中中国是受影响最严重的地区之一。大气气溶胶颗粒物是中国雾霾的主要组成成分,二次有机气溶胶与二次无