基于视频的行为识别技术研究

来源 :沈阳工业大学 | 被引量 : 0次 | 上传用户:Gemini
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来随着人工智能的猛速发展,深度学习在视频行为识别领域发挥着重要作用,其中利用卷积神经网络提取图像的空间特征已经成为主流方法。然而,视频帧中复杂的环境背景、照明条件等与行为无关的视觉信息给行为空间特征带来了大量的冗余和噪声,影响了行为识别的准确性。其次,不同类别的行为视频在时序上可能存在着相似的前后关联,使得网络模型预测失误。本文专为视频行为识别设计一种循环区域关注模型和一种视频帧关注模型以分别解决行为空间特征中的冗余、噪声问题和行为在时序上存在的相似前后关联给识别带来的干扰问题。其次,本文基于视频的空间特性和时序特性设计一种能够端到端训练的深层时空网络模型,模型中包含卷积神经网络、循环区域关注模型、视频帧关注模型和长短期记忆网络。其中,卷积神经网络作为特征提取器,提取视频帧的空间特征;循环区域关注模型中的循环区域关注单元捕捉空间特征中与行为相关的区域视觉信息,并根据视频的时序特性,循环区域关注单元按照视频的时序进行迭代,使得循环区域关注模型能够有效地捕捉行为视频序列每帧的空间特征中与行为相关的区域视觉信息;视频帧关注模型突显整段行为视频序列中较为重要的视频帧,以减少异类行为视频序列间相似的前后关联给识别带来的干扰;长短期记忆网络则学习视频帧之间的前后依赖关系。采用交叉熵损失函数对网络模型进行参数更新,从而使网络模型能够更好的区分行为类别。在此基础上,本文充分利用行为的外观信息和运动信息,分别构建了RGB模态的网络模型和光流模态的网络模型,最后对双模态网络模型的输出进行概率融合,以提升行为识别的准确性。在两个视频行为识别公共数据集上的实验结果表明,本文设计的循环区域关注模型和视频帧关注模型在一定程度上改善了行为空间特征中的冗余、噪声问题和行为在时序上存在的相似前后关联给识别带来的干扰问题,验证了循环区域关注模型和视频帧关注模型的有效性,同时提高了网络模型的识别精度。
其他文献
俄罗斯由计划经济向市场经济转轨的进程持续了二十多年,至今仍未结束。(1)以往学界对俄罗斯经济转轨的研究多以宏观为主,鲜有专门讨论单个企业在转轨背景下的制度变迁问题的著
谷子学名为粟,去皮后俗称小米,具有抗旱、耐贫瘠、营养丰富等优点,是我国北方主栽粮食作物之一,在农业种植结构调整和旱作生态可持续农业建设中占有重要的地位。华北地区为我国谷子的主要栽培地区,该区域以夏谷为主,品种生育期短,对华北夏谷品种进行性状差异分析,对主要农艺性状进行综合评价,可了解各品种农艺性状的遗传表现联系以及主要形状对产量形成的相关性,同时可为华北夏谷田间栽培管理提供生产指导,为新品种培育提
语体是语言使用的功能变体,是为了适应不同的交际需要而形成的语言表达体式。英语语体分为口语体和书面语体,而语体特征是指口语体和书面语体中出现频次有显著差异的语言现象。书面语体形式作为衡量作文质量的隐性标准,对提高学生的写作水平起着重要的作用。综其以往研究,或只关注其词汇、搭配,或只关注其被动语态或连词的特点,缺乏对中国英语学习者和本族语者的书面语体使用差异更深入更全面的研究。研究中国英语学习者的书面
随着互联网各个方向的市场逐渐饱和,用户成为了各家企业争相抢夺的资源,用户增长的重要性越来越强。以电商企业为例,各大平台通常会花费一定的成本,推出多种多样的优惠政策来吸引用户进入平台消费,以此带来用户数量的增长,最终达成营收增长的目标。在付出了巨大成本的前提下,企业会达成短时的用户规模增长效果。但是优惠政策结束之后,企业的新用户往往又会再次流失。新用户的留存问题使得企业无法如愿达成营收增长目标。如何
中国经济的快速发展伴随着环境问题的加重,各大城市雾霾灾害频发、河流污染持续严重,已威胁到公众健康与社会经济的可持续发展。环境质量改善的关键在于对重污染企业进行“源
在全球化经济的背景下,各个国家工业领域的竞争异常激烈。2012年工业互联网在美国推出;2013年“新工业法国”在法国推出;2013年德国推出了非常出名的“工业4.0”;2014年机器
本文分析并总结了我国线路清筛作业的现状和需求,介绍了国内外清筛技术的研究和应用,提出侧切式清筛技术是一个新的发展方向,最后探讨了侧切式清筛机在不同线路上的作业模式
燃气轮机燃烧室过渡段是承接燃烧室火焰筒与透平进口的连接部件,燃气轮机“先加热后降温”的工作原理使过渡段极易产生热疲劳和烧蚀等现象。而现代工业对燃气轮机使用效率的
小学语文课堂评价是小学语文课堂教学中必不可少的环节,也是实现师生互动的重要形式。教师有效运用课堂评价语言,有助于学生形成正确的自我认识,提高其参与课堂的积极性,有助于教学质量的提高和学生的发展。因此本研究的研究目的在于,通过对小学教师课堂评价语使用情况进行研究,发现其中存在的普遍性问题,进而提出针对性的策略,为小学语文教师在课堂评价语的使用上提供参考,以提高小学语文教师课堂评价语运用水平,提高课堂
合成孔径雷达(Synthetic Aperture Radar,SAR)是一种能够全天时、全天候和远距离对目标进行主动观测的系统,已广泛应用于军事和民用领域。SAR自动目标识别(SAR Automatic Tar