低分辨率图像下的二维人体姿态估计算法研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:yusiyuangame
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
二维人体姿态估计是计算机视觉领域中的热点研究课题,最近几年在深度学习的帮助下取得了重大突破。然而对于实际场景中普遍存在的低分辨率(Low-Resolution,LR)图像,基于深度学习的姿态估计方法还无法达到可接受的准确率。LR图像下的姿态估计的难点在于从图像中能够提取的信息有限并且缺乏判别性。已有研究表明超分辨率(Super-Resolution,SR)重建可以有效帮助其它视觉任务处理LR问题。本文受此启发,以SR辅助的姿态估计为基本算法框架,从两方面重建有利于姿态估计的高分辨率(High-Resolution,HR)图像,进而提高姿态估计在LR图像下的准确率。此外,本文还将LR图像下的姿态估计方法与基于人体姿态的行为识别方法相结合,提出了一种基于人体姿态的LR视频下的行为识别方法。本文研究成果如下:(1)通用的SR方法未考虑图像区域语义,导致重建的前背景图像质量处于同一层级,而这会对姿态估计网络产生干扰。为了粗粒度地增强人体区域信息表达,本文提出了一种人体感知的超分辨率(Body-Aware Super-Resolution,BASR)重建方法,以辅助LR图像下二维人体姿态估计。该方法结合区域语义设计了一个定向的SR损失函数。该损失函数可指导SR网络生成人体区域图像质量优于背景的HR图像,从而弱化背景对姿态估计网络的影响。实验结果表明在LR图像下,BASR辅助的姿态估计要明显优于其它方法。(2)为了在BASR的基础上,进一步重建出有利于姿态估计的细粒度图像特征,本文提出了一种姿态驱动的超分辨率(Pose-Driven Super-Resolution,PDSR)重建方法。该方法将姿态估计网络作为判别器,以驱动SR网络隐式地学习对姿态估计具有高判别性的图像特征,并且利用BASR保持像素相似性和增强人体区域的信息表达。实验结果表明了PDSR辅助姿态估计的有效性。(3)针对行为识别中的LR问题,本文将PDSR辅助的姿态估计与基于人体姿态的行为识别相结合,提出了一种基于人体姿态的LR视频下的行为识别方法。该方法以双流卷积网络为基础,不仅通过融合姿态信息提取鲁棒的特征,而且利用PDSR辅助的姿态估计,为网络提供在LR视频下依然可靠的姿态序列。实验结果表明该方法对于LR视频输入能够得到较高的识别准确率。
其他文献
目前我国仍采用容许应力法进行铁路桥梁设计,但随着我国铁路事业的不断发展,国内企业同国外合作项目日益增多,容许应力法已不能满足我国和国际间技术交流的需要,故铁路桥梁设计方法急需从容许应力法向极限状态设计法转变。虽然已经有很多学者对欧美规范的桥梁极限状态设计方法进行研究,但缺少对重力式桥墩的极限状态分析,故本文通过采用中国容许应力法和欧美规范的极限状态设计法对铁路桥梁重力式桥墩进行对比研究,主要研究内
随着我国“一带一路”倡议的不断推进,中欧班列作为国家品牌迅速发展,成为促进中欧贸易的重要载体。目前,中欧班列开行数量增幅逐渐趋于稳定,运输网络逐步完善,提高运营水平是当前阶段的主要目标。现阶段中欧班列仍然存在运输效率难以保证、运到时限不稳定、对特殊状况难以做出调整等问题。因此,基于基本运行图框架,研究中欧班列实际运行计划的优化方法,对于中欧班列的运营水平提高具有重要的现实意义。基于以上问题,本文对
利用机械振动信号来估计振源对机械系统的优化设计、振动噪声控制、状态监测和故障诊断等有着重要意义。工作中的机械系统受到来自外部或内部的各种振源作用,因零部件故障引发的振源都属于内部激励源。从机械振动信号中获得内部激励产生的响应,分源进行评价,更有利于准确和鲁棒的状态监测及诊断。本文通过归纳内激励响应的性质,利用其结构属性,研究基于低秩恢复技术的三种分离模型,由构造的观测矩阵中得到内激励响应。(1)内
有机发光二极管(OLED)因众多优点受到科研人员的关注,未来可能会逐渐取代液晶显示技术,成为下一代主流显示技术。OLED从被发现至今已有70多年的历史,多年来对于OLED器件的研究和开发,使器件的性能不断提高和优化。尽管如此,OLED还是存在着一些缺点,比如使用寿命还不够高,还不能做到极高的分辨率,成本还比较高等。本文将简要介绍OLED器件有关的基础知识,针对目前已经商用的OLED器件与材料进行改
人体运动检测与姿态估计是深度学习与计算机视觉中最具挑战问题之一,在智能监控、人机交互、动作识别等领域有着广泛的应用。本文提出了基于内容描述特征的注意力机制、基于注意力机制的人体运动检测算法、基于注意力机制的人体姿态估计算法。本文的工作内容如下:首先,由于卷积神经网络中的浅层内容描述特征与深层高级语义特征相互补充,但现有方法未能充分利用浅层内容描述特征,所以本文提出了基于内容描述特征的注意力机制。提
我国大力发展山地风电不仅有利于能源结构的转型升级和生态环境保护的提质增效,还可促进土地资源的合理利用和可持续发展战略的全面实施。然而,当大气边界层风流经山地地形时,由于地表粗糙度、山体坡度、山体形状等因素的影响,通常伴随着许多复杂的流动现象,如湍流间歇、分离再附、旋涡脱落等,使得其风速分布沿高度方向非均匀变化并表现出非高斯性,进而导致风能资源评估结果与实际风电场满发小时数产生较大的误差。因此,为促
目的:将课题组前期经抗人呼吸道合胞病毒(Human respiratory syncytial virus,RSV)药物高通量筛选平台筛选出的先导化合物6344B-E6进行结构优化后,继续筛选出活性骨架化合物RSV-A-4,并将其与免疫抑制剂代谢产物6-MMPr分别用于抗RSV活性的体内外药效学研究,以期探寻安全、有效的抗RSV小分子化合物并探讨其可能的抗病毒作用机制。方法:(1)采集志愿者呼吸道
随着社会的不断发展,人们对于车载服务的需求越来越多样化,例如自动驾驶、车载AR导航等。然而,现有的车联网资源无法更好地支撑这些服务:一方面,车载服务对计算资源的需求量较大,现有的计算资源无法满足车载服务的计算需求;另一方面,车辆的移动性使车联网资源分布快速变化,原有的静态资源管理方案将无法解决动态问题。因此,本文将以拓展计算资源、优化资源管理方案为切入点,以系统时延、吞吐量、能耗等因素作为衡量系统
推荐算法的主要目的是发现用户潜在兴趣点,帮助用户在海量数据中快速发现有用信息。由于推荐算法在商品推荐中的突出表现,推荐算法得到了学术界和工业界的广泛关注。衡量推荐算法效果的指标是推荐的准确性,但研究发现过分关注准确性或导致多样性等其他指标被忽视,使得推荐结果过于单调,不利于发现用户新的潜在偏好,无法充分挖掘长尾物品的价值。另一方面,一味提升多样性容易造成准确性的快速下降。因此,如何在准确性和多样性
自闭症(Autism Spectrum Disorder,ASD)是一种复杂的神经系统发育障碍疾病,其临床诊断具有主观性。结构磁共振成像和功能磁共振成像从两个不同模态提供了关于大脑的结构和功能信息,能够为ASD的识别提供客观的生物标记。相比于基于单模态影像数据的识别方法,通过多模态数据融合可以提高ASD客观辅助诊断的准确性。为了利用两个模态的共享特征和模态特定特征,本文首先提出了基于特征表示学习的