论文部分内容阅读
本文对基于视觉的人体姿态检测与估计问题进行了研究。设计并实现了基于静态图像的姿态检测与估计算法,该算法可用于挖掘和理解静态图像中的人物动作,也可作为视频序列场景中处理每帧图像的基本算法;设计并实现了基于视频序列的姿态检测与估计系统,该系统可用于体育运动分析、基于姿态的人机交互等领域。 基于静态图像的算法结合边缘信息与区域信息作为检测依据,有效克服了被观测目标先验信息不足的问题;利用模板匹配方法,结合Pictorial Structure模型自底向上进行肢体位置检测,保证了肢体定位准确率;选择Belief Propagation算法作为估计策略实现结构约束信息,保证了肢体位置检测结果的合理性。 对于视频序列场景,本文实现了一个以离线方式工作的、可扩展的姿态识别与估计系统。文章采用先学习、再检测的模块化设计思路,从肢体外观模型学习、肢体位置检测、判决三个核心部分进行阐述。模型学习模块依据采样评价策略为肢体建立最佳的基于颜色特征的外观模型,具有场景适应性强、模型精确度高的特点;检测模块利用外观模型通过模板匹配与采样算法计算肢体候选分布,具备准确率高、可靠性好的特点;判决模块依据Mean Shift算法思想利用候选分布聚类得到肢体位置。经测试,肢体定位准确率约为90%,能够实现对视频序列中人体动作的追踪。