视频序列中的行为识别技术研究

来源 :电子科技大学 | 被引量 : 2次 | 上传用户:clarinet1900
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于视觉的信息获取是现代信息获取的重要途径之一。视频序列中的行为识别已经成为人工智能、计算机视觉及多媒体应用中的一个重要研究方向。其包括剪切视频中的行为识别和未剪切视频中的行为识别两类任务。识别剪切视频中的行为是在一段剪切好的视频中确定包含某类行为,属于分类问题,而识别未剪切视频中的行为除了需要确定视频中是否包含某类行为之外还需要确定其起始时间,属于检测问题。目前,视频中的行为识别已经成为视频检索,智能监控,人机交互,机器人等领域的一项重要技术。虽然目前国内外研究人员在视频行为识别领域已经取得了一定成果,但依旧面临环境干扰与遮挡,视角多样性,行为多样性,时空语义多样性等困难,仍然是一个极具挑战性的研究课题。卷积神经网络在图像域的成功,也促使卷积神经网络结构及其图像域的方法拓展到视频域,推动了包括行为识别在内的视频域任务的发展。近年来基于卷积神经网络的行为识别方法在行为识别的研究中占据了主导地位,并取得了巨大成功。本文的研究围绕目前基于卷积神经网络的行为识别算法存在的问题,结合图像处理,计算机视觉,机器学习和深度学习等算法进行深入研究。具体研究内容包括:从行为的不同时间尺度描述出发研究基于多时间尺度深度特征的剪切视频中的行为识别,从行为特征的时间演进出发研究基于原子特征时间建模的剪切视频中的行为识别,从不同粒度行为分类器的特点出发研究从细粒度到粗粒度的未剪切视频行为识别。主要贡献如下:(1)提出使用多时间尺度的深度特征来描述行为,完成剪切视频中的行为识别。目前基于卷积神经网络的行为识别方法只提取单一时间尺度上的深度特征,然而一个行为包含不同时间尺度的信息,从多个时间尺度去描述并识别行为可提高行为识别的准确率。因此本文将3D卷积神经网络Res3D衍生出新的版本,用于提取不同时间尺度下的深度信息,在每一个时间尺度上,将在RGB域学习到的知识迁移至光流域以使3D卷积神经网络同时从光流域获取信息。通过判别相关分析融合各时间尺度上提取到的深度信息以产生紧致的视频行为表达。相对于单时间尺度方法,本文提出的多时间尺度方法获得的行为表达维度更低,判别力更强,获得了更好的识别准确率。(2)提出使用行为的原子特征进行时间建模来识别剪切视频的行为。行为可以看作是时空信息在时间上的有序演进。在上述的多时间尺度方法中,行为的表达是基于等权重时空特征的无序建模的。本文使用互信息最大化方法,无监督地从每一个时间尺度下的深度特征中挖掘行为的原子特征,并使用长短时记忆网络对原子特征进行时间建模,来识别视频中的行为。实验结果表明相对于无序建模,本文提出的基于多时间尺度的原子特征时间建模对于剪切视频中行为识别展现出了较高的识别准确率。(3)提出从细粒度到粗粒度来识别未剪切视频中的行为。细粒度分类器易于定位行为的精确边界,而粗粒度分类器易于建模视频帧或视频分割之间的关系。本文在‘时域推荐+分类’的检测框架下,充分利用不同粒度分类器的特点,在时域推荐和分类两个阶段均设计视频分割级(细粒度)分类器和视频窗口级(粗粒度)分类器来实现从视频分割到视频窗口的未剪切视频中行为识别。这也符合人们从细粒度到粗粒度去观察视频的习惯:先从几帧观察行为的存在,再到一段视频确认行为的发生及类别。实验结果表明本文提出的从细粒度到粗粒度的行为识别具有较高的识别精度,且对不同类别的行为具有相对平衡的识别精度。
其他文献
本文译自美国生物学史家艾伦的著作《二十世纪的生命科学》(1978年剑桥大学印)的第七章。这本著作从生命科学内部各个分支学科之间、生命科学与物理学、化学、数学等其他学科
2009年后社交网络逐渐兴起,以微博为代表的社交网络给了广大网民一片“豁然开朗”的公共领域。这片信息空间传播就像是一场“自助餐”,“把关人”和“议程设置”的工作大多由
多径干扰是影响低速水声通信系统的关键问题。文章对低速水声扩频通信系统进行了设计和仿真分析,结果表明,直接序列扩频技术是低速水声通信系统抑制多径效应的一种有效措施。
随着腹腔镜右侧完整全结肠系膜切除(CME)治疗右半结肠癌的推广,右半结肠癌患者从中普遍获益.从传统的外侧入路到如今的中间入路,从开放手术到腹腔镜手术,手术操作不断精细化、
在毛主席革命路线指引下,各地土壤和作物诊断的研究工作发展很快。自1974年以来,全国组织了土壤普查、土壤诊断研究协作组。参加这个协作组的单位有山东省土壤肥料研究所、湖
当代社会农村群众生活水平不断提升,对于精神文化的追求也不断增加。新农村的建设需要加强农村群众文化工作建设,本文从农村群众文化工作情况入手,分析其存在的问题,探讨相应
本文先利用实数的连续归纳法证明了确界原理,然后利用确界原理证明了实数的连续归纳法,说明了二者的等价性。
探索和认识由术数的世界观所支撑的中医理论大厦,对中医学的发展有创新性意义。本文从医学理论的角度分析了《黄帝内经》的主要术数范畴-阴阳、五行、六律、九宫八风、运气干
罗蒂继承并发展了休谟、伯林及奥克肖特等人的自由主义思想,他的自由主义属于“权宜之计”的自由主义,主要表现在三个方面:1、对“强理性”的批判。罗蒂坚决反对强理性以一种