论文部分内容阅读
人体行为识别是计算机视觉的研究难点与热点,在智能视频监控和运动分析等领域有着广泛的应用前景。但目前大部分研究者主要针对视频中的行为展开研究。然而,人类的视觉往往根据单张图像就可判断图像中发生的行为。基于单张静态图像的人体行为识别,挑战性更大,是近年来人体行为识别研究的一个趋势,更是探索人类视觉奥秘的一个很好切入点。因此,开展静态图像人体行为识别具有重要的应用价值和理论意义。 目前静态图像人体行为识别领域还处于起步阶段,对于图像上下文信息对识别精度的影响、不同行为类之间的相似性等问题的研究相对较少。针对这些问题,本文提出基于改进随机森林的静态图像人体行为识别方法。论文的主要工作和创新点如下: 1、针对在图像分类中属于相同类别的图像可能包含不同人体行为的问题,研究影响图像分类精度的因素是否同样对静态图像人体行为识别起作用。使用常用的基于词袋模型的分类方法,在不同的图像表示条件下进行静态图像人体行为识别,研究图像的背景信息以及图像特征的空间分布信息对于识别精度的影响。通过对实验结果的分析,得出了图像背景信息以及图像特征的空间分布信息有利于提高静态图像人体行为识别精度的结论。 2、针对现有静态图像人体行为识别方法容易受到不同行为类之间相似性的影响,提出基于改进随机森林的静态图像人体行为识别方法。方法中使用图像与其他类图像区别最明显的局部区域而不是图像的整体作为图像的分类依据。由于随机森林在处理大数据上的优势,使用随机森林进行图像局部区域的寻找以及最后的分类。与传统随机森林使用弱分类器不同,本方法在随机森林的内部结点中使用了强分类器SVM,降低了随机森林的泛化误差,提高了随机森林的分类精度。最后通过实验证明,此方法的分类精度优于一般常用方法。 总之,本文从图像表示和图像分类依据两个问题入手,首先通过在不同的图像表示条件下进行静态图像人体行为识别,研究图像的背景信息和图像特征的空间分布信息对于识别精度的影响,然后针对不同行为类之间相似性的问题,提出了基于改进随机森林的静态图像人体行为识别方法,最后通过试验验证了本方法的有效性。