论文部分内容阅读
骨骼点检测在人机交互及视频结构化理解中具有重要作用,本论文介绍了如何使用深度卷积网络实现骨骼点检测,并利用边图实现自底向上的多人分离,为了兼顾速度和精度要求,我们利用卷积的Pooling实现分辨率的逐层下降,以降低计算规模并获得较大的感受野,保证关键点能够大致定位准确,为了弥补分辨率下降的精度损失,我们将底层较高分辨率的特征图合并到高层特征图中提升定位的颗粒度。实验表明,我们的网络结构具有较好的速度和精度。