基于时空建模的行为识别算法及其应用研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:dej0415
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体行为识别技术在智慧城市安防、视频检索、人机交互、无人便利超市等领域中有诸多应用,其重要性日益突出。如何有效地对视频序列信息进行时空建模是人体行为识别任务中的一个关键点。许多研究为了更好地对视频序列进行时空建模,采取三维卷积并结合光流等其他运动补充信息的方法,但忽略了所带来的网络难以优化、网络规模与计算量增加的问题。此外,在面临不同行为实例的持续时间长短不一的问题时,许多研究简单地堆叠局部感受野卷积去处理长时序问题,但这样做减弱了远距离帧的信息,因此并不是最优的时空建模方式。针对以上的不足和难点,本文以减少计算量并且提升算法精度为目的,对人体行为识别算法及其应用展开了研究。首先本文提出了一种高效的时空建模算法;然后,将算法进一步扩展至多视角行为识别框架中,提出多视角融合的行为识别算法,并将其应用至电梯轿厢异常行为识别场景中。本文的主要工作及创新性研究成果如下:1.对特征进行了运动信息增强。针对现有方法不足,本文以不增加过多的计算量为前提,设计了一个运动增强重构模块(Motion Feature Enhancement Module,MFEM),将特征中运动信息增强后,和时空信息归并在一个二维卷积网络中进行高效的编码。22.设计了多尺度时空特征融合模块。为了改善现有方法对时序长短不一的行为进行建模的问题,本文设计了一个多尺度的时空特征融合模块(Multiple Spatiotemporal Modeling Module,MSMM)。不同于现有的时空卷积深度上的简单堆叠或者空间卷积提取特征后融合的方法,本文通过多层次残差结构实现多尺度帧间信息的融合,实现更有效地对长时序时空特征进行建模。最后,将MFEM和MSMM进行有效地集成,提出基于运动增强的时空多尺度特征融合行为识别算法。33.实现了基于视角注意力特征融合的多视角行为识别算法并将其应用到电梯轿厢异常行为识别场景中。为了解决单视角存在的遮挡、语义缺失等问题,将前文所提出的时空建模算法扩展至多视角行为识别框架中,设计了通道级别的视角感知注意力(Channel-wise Viewpoint-Aware Attention,CWVAA)模块,提出了多视角融合的行为识别算法。最后,将算法应用于电梯轿厢,改善电梯轿厢视角下常出现的遮挡问题,提升电梯轿厢异常行为识别的准确率。
其他文献
近年来,语音逐渐成为人机交互的重要手段之一。在室内,噪声和干扰,以及由墙壁和其他物体表面反射引起的混响是造成语音质量和可懂度下降的主要原因。由于混响和语音之间的高度相关性,抑制混响是增强语音的一项艰巨的挑战。噪声和干扰则使得室内语音增强问题更为复杂。风噪声具有和语音信号类似的非平稳特性,使得室外语音增强面临挑战。本文将深度学习用于室内及室外语音增强,此外,将阵处理与深度学习相结合,以增强多通道麦克
近年来,深度网络已经在图像识别等计算机视觉任务上获得了突破性的进展,但是,想要将其部署到资源受限的平台上仍然困难重重。自适应推理技术希望通过根据样本难度动态分配计算资源实现模型部署时候的高效推理。多出口网络是最具代表性的自适应推理技术,它在卷积网络的不同深度处依次引入了一系列中间分类器提供预测出口,根据样本难易动态推理。但是训练多出口网络涉及到不同优化目标相互干扰甚至冲突的问题。目前优化多出口网络
[db:内容简介]
随着人类对海洋的深入探索,各式各样的水下装备得到了研制和应用。自主式水下航行器(Autonomous Underwater Vehicle,AUV)、水下滑翔机(Underwater Glider,UG)等水下无人平台成为研究热点。当执行长时间水下任务时,搭载各类传感设备的水下无人平台需要持续地获知位置信息。同时,水下感知数据只有与位置信息关联,才具有实用价值。因此,精确的水下移动节点定位技术对水
近年来,越来越多的租户选择业务上云,以降低运维成本和提高服务质量。部署于云网络上的云网络产品通常采用虚拟化技术,使得同一台物理机上面的若干云网络产品实例可提供给不同的租户使用。然而,这种云网络产品共享同一物理设备的特性往往会使得云网络产品实例故障的危害性更大(例如,某实例异常造成CPU资源耗尽将导致其余云网络产品实例难以为其租户提供高质量服务),进而使得故障排查尤为复杂,最终极大地增长了故障排除所
[db:内容简介]
现代工业过程不断往更大规模、更高集成化发展,给PID控制回路性能的检测诊断领域带来了挑战,运行过程中时常会出现控制性能不良的问题。性能不良的控制回路若无法及时得到改善,将会增加原材料的消耗及能耗,影响工业产品的产量与品质,甚至对工业过程的安全运行造成影响。控制性能下降的一个重要表现是控制回路产生振荡行为。由于工业过程的耦合和集成,单个振荡可能会在整个系统内广泛地传播,增加了系统的不稳定风险,因此,
如何对公立医院采购业务进行内部审计监督,是实践中的一大重点难点课题。本文基于风险导向的理念,梳理公立医院采购业务流程,识别评估流程中的重要风险点,并针对风险点制定审计策略,以有效履行内部审计的监督职责。
[db:内容简介]
无限带宽(InfiniBand)网络凭借高带宽、低延迟、易扩展的优势被广泛应用于数据密集型和计算密集型场景,加速了数据中心与高性能计算的发展。无限带宽网络集中式的管理架构要求高层管理软件实体通过特定的管理消息向网络节点传达管理指令。各网络节点通过管理代理这一底层软件实体响应网络管理行为,实现稳定、可控的网络环境。因此,本文基于CPU+FPGA组成的异构多处理器片上系统,提出了一种应用于嵌入式主机通