论文部分内容阅读
人体行为识别是智能视频实时监控中非常重要的一部分,该研究对于维护公共安全、打击犯罪、国家防卫都有着巨大意义。人体行为识别的研究涉及到图像处理技术、计算机视觉技术、模式识别技术等多个领域知识。传统人体识别技术需要预先进行图像的特征提取,然后使用机器学习算法对其进行识别和分类,主要缺点是需要对每个要提取的特征都要有较为深入的先验知识,在不同的应用场景下,需要人为设计提取不同的特征。深度学习理论的发展,给图像处理等领域带来了崭新的思路和无限可能。其中最为代表之一的卷积神经网络更是以其可以直接输入图像本身、无需另外设计特征等优势成为新的研究热点。卷积神经网络通过将网络稀疏连接以及共享权值等方式,有效降低网络的复杂度,增强了模型的训练效果,从而广泛地应用于计算机视觉领域中的目标识别、人脸识别和图像分类等问题中。本文的主要研究工作有:设计了一个随机Dropout卷积神经网络模型用于人体行为识别任务。针对卷积神经网络在训练样本较少时存在的过拟合现象,对深度学习理论中几种实现模型平均的方法进行总结,并对其中之一的Dropout方法进行改进,改进后的方法称为随机Dropout。将随机Dropout应用到卷积神经网络模型的分类器阶段,在网络训练过程中随机选择"冻结"一定比例的神经元权值,使每次网络更新时神经元的连接次序都发生变化,从而使网络权值的更新不再依赖于有固定关系隐含节点的共同作用。在Weizmann人体行为识别数据集上进行实验,将加入随机Dropout的卷积神经网络与未加入的进行比较,加入随机Dropout的网络在各类行为识别上均取得了较高的识别率,可以有效防止过拟合。在随机Dropout卷积神经网络模型的基础上,进一步优化网络结构。包括两方面内容:一方面,调整网络模型在特征提取阶段的神经元类型,结合使用Maxout激活函数神经元,加入Maxout隐含层,从而增长卷积神经网络模型的长度;另一方面,在本文设计的卷积神经网络模型的采样层部分,进行不同采样方式的对比实验,分析卷积神经网络的不同采样方式对识别结果的影响。在Weizmann数据集上进行实验,实验结果表明,与基本的Dropout卷积神经网络模型相比,使用随机Dropout+Maxout的卷积神经网络模型在人体行为识别问题上可以获得更高的识别率。