论文部分内容阅读
在现实的生活视频中,检测人体动作以及分类时,常常会出现视频背景复杂、模糊,以及因人多导致多种动作行为同时出现的问题,而致使检测和判别某种行为结果出现偏差。因此文中针对2D CNN对单个帧进行提取特征却没有包含实际视频中连续多帧之间编码的运动信息,提出一种基于三维卷积神经网络识别方法,旨在更好地捕获视频连续帧中隐藏的时间和空间信息。实验结果表明,与现有的几类方法相比,所提方法识别率得到较为明显的提升,验证了该方法的有效性和鲁棒性。