论文部分内容阅读
针对计算机视觉中基础性的视频人体行为识别的问题,从基于3D卷积的方法、基于双流网络的方法和基于循环神经网络的方法三类主流方法入手,对三类方法分别进行了阐述。三类方法的核心思想都是挖掘视频所固有的时空特征,区别在于特征挖掘所使用算法的不同,详细分析了每一种方法在处理视频的时空特征时的优缺点,并且在每一类中选取若干主流方法,将其准确率进行对比。通过实验数据对比表明,双流网络由于兼备更为完整的时空特征,从而具有更高的行为识别的准确率。