基于深度学习的视频行为识别研究

来源 :华北电力大学 | 被引量 : 0次 | 上传用户:zhaodhsnd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频行为识别技术利用计算机对视频序列中人体的动作进行分析和识别,是计算机视觉领域的研究热点,在智能监控、智能家居、人体异常行为检测以及人机交互等领域都有着非常重要的研究意义和广阔的应用前景。目前提出的行为识别模型通常仅使用视频的外观信息和短期运动信息,缺乏学习长时间序列间依赖的能力,因此本文进一步研究并改进行为识别方法,使之能够更好地适用于实际生活中。针对视频中人体行为识别问题,本文使用两个独立的卷积神经网络分别提取视频序列的空域信息和时域信息,然后结合长短期记忆神经单元(LSTM)构成长效递归神经网络(LRCN)对视频中的人体行为进行识别。利用LSTM单元引入视频序列间的依赖关系,使LRCN网络能够处理长时间结构的视频序列。通过实验验证了LRCN行为识别模型具有良好的鲁棒性和泛化能力,并探讨了LRCN模型在电力系统中的应用。LRCN行为识别模型处理长时间视频序列时采用密集采样帧序列策略,易产生大量冗余信息增加网络计算成本,且对于跨越长时间的复杂动作不能很好的学习到远程时间结构。本文使用对整个视频进行稀疏采样的时间分割网络(TSN)作为基础模型代替LRCN网络进行远程时间建模,通过结合时间金字塔池化方法构成TSN-TPP网络进行人体行为识别,能够将多个时间尺度的帧级特征聚合成固定长度的视频级特征,增强了视频内的弱时间结构。实验结果表明本文方法能够有效提高行为识别准确率。最后,本文还将基于LRCN网络和TSN-TPP网络的行为识别模型移植到基于GPU加速的嵌入式平台Jetson TK1上,实现了在前端设备上也能够进行人体行为识别,减轻了服务器终端处理大量视频数据的压力。
其他文献
介绍中文WINDOWS下运行的测量平差系统.该系统能对各种网进行平差处理.
目的对肾移植患者和维持性血液透析患者生活质量水平的差别进行比较。方法选取我院收治的120例泌尿外科与肾脏内科患者作为研究对象,60例为肾移植患者,60例为维持性血液透析
2012年12月20日,共青团常州信息职业技术学院第三次团员、学生代表大会开幕式隆重召开。团省委学校部副部长常晓岚,团市委副书记薛晔,团市委学少部部长钱小锋,院领导邓志良、眭碧
期刊
小学语文教学中,运用电子白板技术辅助语文教学,可以创设教学情境,激发学生学习兴趣,调动学生学习的积极性,能促使学生深入理解课文内容,强化基础知识,畅通反馈信息渠道,精准
给出了无滑动滚动时滑动摩擦力不作功的一种解释.
改革开放以来,能源的市场化改革在一些领域有所突破,但并未全面完成,总体上处在计划与市场并存的双重体制下。如果说能源的粗放利用是雾霾的成因,那么不合理的体制也是雾霾的
探讨了低碳园林的涵义以及如何具体的来实施低碳园林,为日后的园林工作者提供最新的低碳园林的实施策略及方法,最大程度减少二氧化碳的排放,才能真正创设环保、节能、低碳、
目的评估各实验室利用限制性抗原亲和力酶联免疫试验(LAg-Avidity EIA)检测1型艾滋病病毒(HIV-1)新发感染的能力,提高我国HIV-1新发感染实验室检测的准确性。方法按照GB/T 27
随着油气勘探水平的不断提高,油气勘探在提交控制和预测储量方面也提出了更高的要求。一直以来,针对鄂尔多斯盆地西北部GF地区主力油层长8和长6的研究却主要集中在地质大层,
学生在接受教育的过程中,关键就是对核心素养进行培养,而小学是核心素养培养的关键阶段,因此,小学语文教师在教学的过程中要加强对核心素养培养的关注度,不断提高教学质量的