【摘 要】
:
基于视频的人体行为识别是计算机视觉领域的一个热门研究方向,在智慧安防、人机交互、视频检索等方面有广阔的应用前景。基于视频的人体行为识别存在时空特征交互困难、视频帧大量冗余、环境噪声多等问题。本文提出一种时空增强长短时记忆算法(STA-LSTM)用于视频行为识别,该网络主要包含注意力、3D卷积、LSTM网络等部分。主要工作如下:(1)针对时空特征交互困难问题,提出基于C3D特征提取网络,利用Spor
论文部分内容阅读
基于视频的人体行为识别是计算机视觉领域的一个热门研究方向,在智慧安防、人机交互、视频检索等方面有广阔的应用前景。基于视频的人体行为识别存在时空特征交互困难、视频帧大量冗余、环境噪声多等问题。本文提出一种时空增强长短时记忆算法(STA-LSTM)用于视频行为识别,该网络主要包含注意力、3D卷积、LSTM网络等部分。主要工作如下:(1)针对时空特征交互困难问题,提出基于C3D特征提取网络,利用Sports-1M数据集进行预训练,该网络能够高效提取视频中的时空特征。3D CNN相较于2D CNN最大的特点是加入了时间维度的信息,可以将多个视频帧堆叠作为输入,这种对连续的多个视频帧的卷积操作可以实现同时提取时空特征。(2)针对视频帧大量冗余的问题,提出一种时空注意力模型(STA),该模型能够捕获视频在时间、空间上的相关性,将注意力集中在视频的关键视频帧以及视频帧的关键区域。在时间上,通过全局最大池化形成一个一维向量,通过对这个一维向量进行操作,计算时间上的注意力权重向量;在空间上,对通道进行全局最大池化和全局平均池化,对池化后的矩阵运算得到空间上的注意力权重矩阵。(3)针对3D卷积处理长期视频时序信息不足的问题,提出利用LSTM网络对3D CNN提取到的特征序列进行二次特征提取。由于3D卷积网络输入的连续的若干帧包含的时间信息比较少,提取到的时间特征也不足以准确实现行为分类。因此,需要融合长短时记忆网络(LSTM)对3D卷积提取到的特征序列做二次特征提取,捕获到长期的时间特征用于行为分类。(4)针对环境噪声的问题,提出利用混合高斯模型做背景建模,能够有效去除背景噪声,得到没有干扰的行人信息。用本文提出的时空增强长短时记忆算法(STA-3D-LSTM)在大型公开数据集UCF-101和HMDB51上进行训练测试,结果表明,提出的算法提高了网络的判别能力,体现了所提出的算法的优越性。
其他文献
在汽车生产线中,涂胶缺陷是指在工业生产中由于机器人与汽车接触问题、胶量问题以及技术问题出现的漏胶、断胶、胶体过窄、胶体过宽等现象。汽车涂胶缺陷危害巨大,甚至危害人类生命,本课题针对汽车的涂胶质量检测研究了一套基于卷积神经网络的涂胶缺陷目标检测技术。目的在于为汽车制造业行业提供一种高效的、有实用价值的汽车涂胶检测技术手段,帮助企业更好控制涂胶质量,同时节约成本,并且提高生产率。目前,基于是视觉的汽车
装配是产品生产的重要环节,对于提高产品质量、降低生产成本有重要意义。在机翼装配生产中,进行装配路线智能规划和装配仿真能够有效提高装配效率,发现并修改存在的问题。本文以飞机机翼装配为例,使用遗传算法计算出各装配单元的装配顺序,使用专家系统生成各工序的装配方案,然后编写装配相关文件,对机翼的三维模型进行装配仿真,最终飞机机翼实现高质高效的装配。具体研究工作如下:(1)总结机翼装配顺序评价函数。了解机翼
针对空地导弹受到过载约束、导引头视线角的测量范围、自动驾驶仪延迟、干扰等因素的影响,无法对攻击目标造成致命毁伤,本文基于最优控制理论研究带终端落角约束的制导精度优化问题,旨在提出同时满足脱靶量要求和导弹期望落角的末制导律。主要研究内容如下:首先,根据导弹末制导阶段的弹目相对运动关系,推导出弹目相对运动方程。为了更好的理解导引律的研究过程,对弹目运动模型进行线性化和小角度假设,仿真验证了模型线性化不
飞行训练是滑翔伞运动的重要环节,为更好地推广这项运动,提供更安全的训练环境,要在保证日常飞行训练任务的同时确保训练过程安全可靠,并尽可能地降低空中飞行的训练成本。目前国际上通用的飞行训练方法是采用飞行模拟器。各类飞行模拟器的研制已成为航空四大试验研究设施之一,因此,滑翔伞模拟器的研制具有重要的意义。对于模拟器控制系统的设计,PLC具有可靠性高,操作容易的优点,为此本文采用PLC为主控单元,通过与触
随着使命任务复杂性的提升,现有的水下机器人难以满足多任务需求,因此需要一种新型的推进与操纵方式,用于提升水下机器人机动性。为此本文借鉴了航空领域的流体推力矢量技术,提出了一种新型的水下机器人推进与操纵技术即流体推力矢量喷管技术,并进行了深入研究。完成矢量喷管结构设计,并进行组装调试以及搭建实验平台,完成多级泵流量测试,提出了操纵力、主流变化系数、二次流效率以及流体推力矢量角等四个参数用于评价喷管力
随着现代战争中火炮扮演的角色越来越重要,对炮弹的发射精度也提出了更高的要求,因此维护炮膛身管的内部环境得到更多的重视。炮膛身管内的积碳不能得到彻底清除会引起内膛腐蚀甚至影响炮弹发射精度。由于炮管口径太小、身管过长,内部阴阳线凹凸槽构造造成膛内清洁困难。传统人力清洁炮膛身管费时费力,由于膛内工作环境的特殊性,又加大了炮膛清洁机器人模型构建的难度,国内、外针对炮膛自动清洗机器人的设计资料并不丰富。针对
随着计算机视觉的不断发展,目标检测与跟踪技术也成为了研究的重点。无人机对车辆跟踪无论是在交通领域,还是在公共安全领域都有着重要用途。在无人机对车辆跟踪时,会出现车辆行驶环境复杂、车辆容易出现遮挡和车辆在不同光照强度下引起的颜色变化以及车辆在不同运动状态下形状变化的情况,上述情况降低了车辆跟踪算法的精度。鉴于此,本文以无人机在高度15-20米内,拍摄的视频为研究对象,展开对视频中车辆跟踪方法的研究与
随着工业自动化及仓储物流自动化的发展,码垛机器人越来越普遍的应用于各种生产环节中。码垛机器人主要的控制方式有示教编程、离线编程和模板匹配算法等,技术较为成熟,目前广泛应用于限定工作场景下,能够对目标物进行准确位姿估计与识别。但是,当目标物存在相互遮挡、不规则码放和室外复杂环境光照场景时,现有方法容易产生偏离误差,难以满足工业自动化需求。为解决码垛机器人复杂场景下自动作业的问题,设计了基于视觉深度学
随着机器人技术发展和医疗水平提高,机器人辅助手术模式广泛应用于微创外科手术。单孔手术通过单一切口将器械送入病人腹腔内,具有创伤小,失血少,恢复快等优点。继多孔微创手术机器人研发成功并商业化后,单孔凭借其从端器械工作空间要求更低,创伤更小,术后恢复效果更佳等优势成为外科微创手术机器人主要发展方向。在腹腔微创手术中,为了增大器械工作空间,提高姿态灵活性,单孔悬挂臂带动器械以手术切口为支点进行远心运动,
形状匹配是目标识别系统中不可或缺的步骤,其中基于轮廓片段的目标识别是一个很有前途和必要的研究方向。本文以轮廓片段为中心,研究了目标物体的轮廓提取算法、轮廓分段的获取算法、轮廓分段的可信度评价以及轮廓分段的加权相似度匹配算法。全文的主要研究内容如下:研究了轮廓提取算法。为了消除彩色图像传输中的噪声等因素的影响,对图像进行灰度图像增强操作来提升图片质量,将灰度化后图像先平滑降噪,再进行锐化增强处理,使