论文部分内容阅读
随着计算机技术的发展和计算机视觉原理的广泛应用,计算机理解人体动作和行为已成为高层计算机视觉技术的一个重要发展方向。本文在总结以往人体行为特征提取、人体行为识别算法的基础上,围绕着真实世界二维视频里的人体行为感知问题,从检测人体目标轮廓和提取人体行为特征出发,重点研究了形状边缘轮廓特征的描述算法,以及提取的特征在动态时间规整匹配问题上的应用。本文结合环境上下文来感知人体行为,并提出一个连续的人体行为感知算法框架,该框架通过对大量人体行为视频的跟踪和识别,形成人体行为分析算法的基础。本文研究内容如下:(1)研究了图像目标检测与分割的基本理论、算法流程与算法特点,包括Canny检测算子与混合高斯背景建模法。在融合了两种算法的基础上检测出人体动作的间断轮廓;(2)研究了质心距离、傅里叶描述子、Hu不变矩和骨架特征这四种人体行为特征提取与表示方法,包括这四种特征描述法的准确性比较。同时研究了动态时间规整算法的基础理论与算法流程,针对规整过程中图像的帧间匹配准则,分析了三种相似性度量算法的优缺点,并选择欧氏距离作为人体行为感知算法框架中的帧间匹配准则;(3)实现了基于动态时间规整的人体行为感知算法关键技术,包括检测人体目标与提取人体轮廓,提取与描述形状特征,基于动态时间规整算法的动作识别与场景识别。通过人体行为公开数据库的视频数据,对这套算法框架的效果进行测试,该算法框架取得了较好的感知效果;(4)针对提取得到的人体轮廓非封闭并且间断的问题,为了使后续轮廓跟踪算法得到更加准确的轮廓点序列,本文提出一种类似于最小生成树的方法补全间断的轮廓点。在进行图像帧匹配时,为了弥补人体轮廓的相似性容易受到两个目标尺度影响的缺陷,本文采用一种自适应加权融合方法来融合质心距离和傅里叶描述子,并且将特征向量的斜率之差作为轮廓相似性的比较依据,使得行为识别结果准确性提高。