基于深度学习的行为识别及其在基建现场的应用

来源 :西安科技大学 | 被引量 : 0次 | 上传用户:nhekccxeadk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了进一步保障公共场所内的安全与稳定,基于视频监控的人体行为识别技术得到了全社会的广泛关注。已有的基于深度学习的人体行为识别方法计算复杂度高、模型泛化性差且很难准确识别。本文对现有模型的优缺点进行分析,从模型的实用性和识别性能角度出发,以原始的双流卷积神经网络为基础并提出了两种改进模型。针对卷积神经网络(CNN)只能提取视频中静态特征和局部运动特征的问题,本文提出在空间流网络中融入长短时记忆网络(LSTM),在时间流网络中用三维卷积(C3D)网络代替原二维卷积网络,形成改进的双流CNN-LSTM和C3D的网络结构,进一步加强视频中时序信息的学习,再使用加权融合的方式对两路网络Softmax层输出的决策分数进行加权运算,获得行为分类结果,但准确率还不够高。针对双流网络模型仅仅在决策分数阶段进行融合导致行为识别准确率较低的问题,本文提出在特征层面对空间流网络和时间流网络进行融合,此融合方式必须保证两路网络结构相同,鉴于三维卷积的优越性,在上述改进的基础上继续将空间流网络替换为C3D网络,形成改进的双流C3D网络结构,融合方式包括Conv5b融合、Fc7融合和hybrid融合。该网络在行为识别任务上达到了较好的识别效果。针对行为识别大多使用公共数据集,很少研究特定场景下异常行为识别的问题,本文除了使用公共UCF-101数据集,还建立了基建现场异常行为检测数据集,用迁移学习的方法对走路、跑步、工作、跨越警戒线、摔倒、打架、向下抛物七种行为进行识别。实验结果表明,改进的双流CNN-LSTM和C3D的网络结构在UCF-101数据集中达到了 90.24%的准确率,在基建现场异常行为检测数据集中达到了 95.97%的准确率。改进的双流C3D网络结构在以上两种数据集中的准确率分别达到了 92.47%和97.51%。改进的网络模型不仅对UCF-101数据集中101类行为的识别效果较好,也在特定基建现场数据集中7类行为的识别时展现出优越性,本文将理论结合实际应用场景,使得行为识别的研究更有意义。
其他文献
声音信号在生活中无处不在,人们一直在尝试着合理地将其利用。随着深度学习技术的发展,声音信号处理的能力在不断提高,给人们的生活带来了诸多便利。声学场景分类作为信号处
针对语义驱动的三维模型部件分析与形状模型的构建,提出了模型局部成分分析和模型整体形状统计建模的相关算法,并加以应用。模型局部成分分析和整体形状建模是即相互联系又相
与锂离子电池相比,镁离子电池具有相对较大容量和使用安全等性能而被广泛关注。MgMn2O4具有较高的开路电压(2.8 V)和理论比容量(270 mAhg-1),而且在动力学和热力学上又具有较大
接触网绝缘子是确保电气化铁路系统安全运行的重要部件。因其长期暴露在户外环境,表面聚集沙尘等污物颗粒后电气特性削弱,容易引发污闪,危及列车行驶安全。因此,需要对接触网
透明导电薄膜作为触摸屏、平板显示器和太阳能电池等光电器件的重要组成部分,其制备工艺直接影响到光电器件的成本和效率。与真空蒸镀、溅射等物理方法相比,溶胶凝胶法在制备
电渣重熔是冶金工业中一种钢铁二次精炼的方法。由于在重熔过程中去除了硫、磷等杂质,所以电渣钢质量好、应用广泛。随着经济的发展,市场对高端钢铁的需求越来越旺盛。然而,
通风机是煤矿企业生产中极为重要的设备之一,轴承作为维持通风机稳定运行的关键部件,起着驱动和减少摩擦的作用,对其进行状态监测和故障诊断具有非常重要的意义。本文以通风
随着分子科学的发展,越来越多的双稳态体系被用作分子基材料器件的载体,在温度传感器、光开关及信息记忆、存储等领域得到应用。可逆的自旋转换伴随着滞后现象和颜色变化,使
以纳米粒子为基本单元,构建高级有序的纳米结构,实现功能增强和功能集成,是纳米科学和材料科学的重要研究方向。研发简单、快速、高效的纳米粒子聚集体的制备方法,实现形貌、
本作品是对上海《东方体育日报》的总编辑杜旻进行的深度人物采写。杜旻的身份历经《新民晚报》体育记者,《新民体育报》记者,《东方体育日报》主编等。本作品主要讲述他率领