论文部分内容阅读
人体行为识别是当前计算机视觉领域的一个重要研究分支。针对视频人体行为识别任务需要大型数据集预训练以及无法有效利用跨时间信息的问题,本文提出了基于双流卷积网络与膨胀3D卷积网络的深度神经网络模型,并重新设计网络结构,命名为多流3D融合网络。首先,利用改进的双流网络与膨胀3D网络提取人物动作特征;其次,利用分段长短期记忆网络提取时间特征;最后,利用残差连接方法融合特征,得到最终的个体识别结果,实现了精确的个体行为识别。在volleyball数据集上的实验结果表明,本文提出的方法优于当前的一些先进方法。