基于深度学习的婴儿姿势估计算法研究

来源 :电子科技大学 | 被引量 : 2次 | 上传用户:heyfeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着深度学习领域的火热发展,基于深度学习的许多领域如雨后春笋般快速发展,其中对于人体姿势估计就是一个热门研究方向,并且已经取得了巨大的成果,例如卡内基梅隆大学发布的openpose。然而关于婴儿的动作理解和分析领域目前还是一个孵化期,基于此,本文首次将当下的最先进的姿势估计模型通过迁移学习对婴儿姿势估计展开研究,主要的研究内容有以下三点:第一,本文首先研究单个婴儿姿势估计,选取经典网络架构stacked hourglass作为预训练模型,构建单个婴儿关键点数据集,采用关键点正确比例(Percentage of Correct Keypoints,归一化采用头部长度,即为PCKh)衡量性能,在测试集上PCK@0.5达到了90.8%,一幅图像平均处理时间为0.2秒。尽管性能较高,但是对于复杂的多个婴儿的情况不能抓取到姿势,会出现误判。第二,为了让模型更加实用,从多个婴儿的角度展开研究,选用当下的明星架构openpose作为网络架构,以tensorflow重构原来的caffe架构,仿照COCO构建多婴儿关键点数据集。本文提出了基于openpose的3-stage模型,然后分别对openpose,训练后的6-stage模型,以及本文的3-satge模型进行实验,其中6-stage和3-stage性能均优于openpose。对于单婴儿情况,6-stage和3-stage分别为91.1%和90.0%,在多婴儿的平均精度均值(mean Average Precision,mAP)比较中,6-stage和3-satge分别为76.8%和75.7%。结果基本在一个精度水准,但是运行时间相比,3-stage单幅图像约为0.22秒,较之于6-stage的约0.4秒几乎提升了一倍。证明了在婴儿的应用场景下,3-stage的调整是成功的,即为本文的创新模型——基于openpose的3-stage婴儿姿势估计预测模型。第三,将本文的3-stage预测模型应用于视频婴儿姿势估计,对视频采用跨帧处理,结果表明,无论是光线昏暗还是明亮,都能实现对婴儿的姿势准确定位,其中对于单个婴儿视频FPS数值为11,多婴儿视频FPS数值为8秒左右,初步达到视频的跟踪估计。总体来说,本文以深度学习为背景,以迁移学习为指导,借鉴前人的网络模型架构,准备本文的婴儿数据集,分为单婴儿和多婴儿两大路线展开研究,最终确立了基于openpose的多婴儿架构为核心,提出了本文的基于openpose的3-stage婴儿姿势估计预测模型,实现了基于视频的婴儿姿势估计。
其他文献
采用过硫酸铵(APS)和亚硫酸氢钠(SBS)作为引发剂,N,N’-亚甲基双丙烯酰胺(MBA)作为交联剂,在水性聚氨酯(WPU)水溶液中引发N-异丙基丙烯酰胺(NIPAAm)单体聚合,获得聚N-异丙基
本文报导五例不同证型的液气胸患者经辨证治疗后均获痊愈,从而说明了辨证施治乃中医的精髓。
在现代轿车产品设计中,安全性、轻量化的车身是人们普遍追求的目标,这使得对轿车车身进行刚度分析和结构修改变得越来越重要。研究车身结构模型修改的方法,主要目的是对车身
浅议西方经济学家关于企业家作用的论述顾国祥,罗殿军企业家的职能历来为众多的经济学家所关注,他们从不同角度论述了企业家在经济和企业发展中的作用。本文主要从经济学的角度
背景:假体松动和感染是人工关节置换失败的常见原因,因此两者的鉴别非常重要。因大多患者无典型的临床表现,其他实验室检查的确诊方法也非常有限。目前,放射性核素骨显像与CT
随着住房建筑工程的快速发展,在此基础上也产生了大量废弃的混凝土,这些废弃混凝土如何处理已迫在眉睫。再生混凝土技术的出现正好完善的解决了这一难题,其作用主要是可以将
本文结合经济预测,对我国未来中长期2010-2050年劳动力需求进行了定量预测。预测结果表明,随着经济增长方式的转变、劳动生产率的提高,我国未来劳动力需求有下降的趋势,但下
为研究重组禽流感病毒(H5+H7)二价灭活疫苗(H5N1 Re-8株+H7N9 H7-Re1株)的不同免疫剂量对融水香鸭免疫的效果。选取120只14日龄的商品融水香鸭,按照随机原则将其划分为试验一
目的研究肿节风、玄参在体外对超氧阴离子自由基()的清除率影响,进一步探讨其药理作用机理。方法利用AP-TEMED系统产生超氧阴离子自由基及比色测定法,在分别加进肿节风、玄参