基于时空特征的视频行为识别

来源 :东南大学 | 被引量 : 0次 | 上传用户:tklyzh1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智能监控和视频获取设备的普及,视频中的行为识别由于其巨大的应用前景和经济价值成为计算机视觉领域的研究热点。而深度学习方法在图像处理任务中的成功应用,也激励了基于深度学习的视频行为识别方法的发展。视频行为识别的研究目的在于通过对人体行为的特征提取和深度神经网络的学习使得计算机能够自主识别视频中的人体行为,从而可以应用于智能监控、视频检索、人机交互等领域。不同于图像分析,视频中时序结构导致了更加丰富的类内与类间差异,增加了行为识别的难度。本文针对如何提取更具代表力的时空特征分别从视频采样方法、图像特征编码、时序特征学习三个方面展开了研究,主要工作如下:1)针对当前的视频行为识别方法对视频稀疏采样的过程中采用的随机采样策略容易错失视频中的关键信息,提出了基于关键帧采样的行为识别方法。该方法在卷积神经网络的训练过程中,依然采用随机采样的策略以保证特征提取的多样性,在测试阶段,则采用关键帧采样策略,通过对视频均匀分段并提取每段中信息熵最大的视频帧作为关键帧来保证神经网络能够最大化地学习视频中的信息。实验通过在时序分割网络、高效卷积网络两种网络结构中使用关键帧采样策略提高了UCF101和HMDB51数据集上的识别准确率,证明了该采样方法的有效性。2)针对神经网络中的简单池化方法只能关注到行为部分子类特征,提出了基于局部特征聚合向量(VLAD)编码的行为识别方法。VLAD编码通过计算图像局部特征在聚类簇上的残差和来有效地聚合图像中的局部特征,本文将图像场景识别中的net VLAD网络结构引入到视频行为识别中,视频帧经过卷积网络提取图像特征后,使用VLAD编码生成全局特征向量,再经过时序融合得到视频的整体描述用于分类,其中本文设计了四种时序融合方案,包括逐元素相加、逐元素最大、逐元素相乘和多尺度时序关系融合,其中多尺度时序关系融合方案使用多层感知机学习不同长度的采样帧序列的时序关系,取得了最优的性能表现。3)针对简单的时序融合方法无法充分学习视频中的时序上下文,提出了基于长短时记忆网络融合VLAD向量的行为识别方法。该方法使用卷积神经网络提取图像特征,经过VLAD编码后,使用长短时记忆网络学习特征向量中的时序上下文,最后融合所有时刻的预测结果对输入视频分类。该框架通过UCF101、HMDB51、something-something数据集上准确率的提升验证了其学习时序上下文的能力。
其他文献
在大城市住房资源紧缺、土地利用高度集约化的情况下,外廊式集合住宅具有比常规单元式住宅更好的灵活性与公共性,从节地节能角度也更加有利于建设出面向广大中低收入人群的高
随着经济的飞速发展,人们对出行的便捷性、舒适性和安全的要求日益增加,关于无人驾驶车辆的研究应运而生。无人驾驶技术研究大势所趋,且无人驾驶车辆作为未来道路交通流的重
新世纪以来,我国桥梁建设发展迅速,大跨桥梁设计和施工实力不断提升,桥梁结构类型多种多样,各类异形桥塔的使用丰富了桥梁体系的外观,受力性能也与常规桥梁存在差别。柳东大
互联网通信安全性非常关键,因为它影响着用户的隐私和安全。为此,“安全套接字层协议(SSL)”及其后续协议“传输层安全协议(TLS)”被创建。这些协议保障着在网上实现安全连接
本文设计并制备出不同疏水链长的硫酸盐-季铵盐型两性Gemini表面活性剂,研究了硫酸盐型-季铵盐型两性Gemini表面活性剂的表面活性以及驱油效率,并取得了一些新的研究成果。以
随着科学技术的发展,大多数操作系统需要跨平台操作,但是现有的异构签密方案中发送者和接收者的系统主密钥大多数是相同的,无法满足实际需求。同时,现有的异构签密方案研究的
随着全球核电工业的不断发展,放射性核素U和Cs逐渐被人们所开发利用。然而在人类和平利用核能和富集使用放射性核素的过程中,也产生了大量的放射性核污染。其中238U、235U和1
同步自动机是一类很常见且有广泛应用的自动机,关于同步自动机最短同步字长度的Cerny猜想目前是自动机的组合理论领域存留时间最长的公开问题。对于至少有3个状态的自动机,如果Cerny猜想成立,那么极值同步自动机(即最短同步字长度为(n-1)2的n-状态同步自动机)就是同步自动机的极端情形。只有本质字母的极值同步自动机称为极端同步自动机。已知的极端同步自动机只有Cerny自动机Cn(n≥3)和另外8个
油菜甾醇类植物激素(BRs)对植物生长具有显著的促进作用,是公认的广谱、无毒的植物生长调节剂。虽然其广泛存在在植物体内,但含量极微、难于提取、化学结构不稳定性且人工合成
神经元凋亡是人类免疫缺陷病毒相关神经认知紊乱(Human Immunodeficiency Virus-Associated Neurocognitive Disorder,HAND)的主要病理特征。神经元凋亡与HIV-1 Tat蛋白(简称