基于堆叠沙漏网络的人体姿态估计

来源 :计算机系统应用 | 被引量 : 0次 | 上传用户:asdfzxcvasdf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体姿态估计在许多计算机视觉任务中起着重要的作用,然而,由于姿态的多变、光照、遮挡和分辨率低等因素,它仍然是一个具有挑战性的问题.利用深层卷积神经网络的高级语义信息是提高人体姿态估计精度的有效途径,本文提出了一种改进的堆叠沙漏网络,设计了一个大感受野残差模块和预处理模块来更好地获得人体结构特征,以此获得丰富的上下文信息,对部分遮挡、大姿态变化、复杂背景等有较好的效果,此外,还对不同阶段的结果进行了融合,以进一步提高定位精度,在MPII数据集和LSP数据集上对本文提出的模型进行实验和验证,结果证明了本
其他文献
基于医疗影像的辅助诊断技术正处于快速发展阶段,但是受医学影像数据量的制约,使得基于深度学习的建模方法无法向更复杂的模型进行探索.本文从医学CT影像数据增强方法出发,概述了医疗影像病灶图像的成像特点,针对病灶检测及分割任务对现有方法进行了归类总结,并阐述了当前医学影像检测和分割的难点.分别从病灶检测相关技术、影像数据增强方法、基于生成对抗网络(Generative Adversarial Netwo
期刊
"工业4.0"的目标之一便是将传统工厂打造成智能工厂,随着智能工厂的出现,传统的网络安全无法满足企业及用户的需求.针对智能工厂及其产品中隐私信息易泄露等安全隐患,文中结合射频识别技术及区块链技术,提出一种超轻量级的适用于智能工厂系统的认证方案.方案将经典的射频识别技术与刚兴起的区块链技术相结合,即可保证安全的情况下,减少计算量;方案基于区块链去中心化的机制实现用户所需安全需求,基于射频识别中双向认
期刊
现实场景中人群尺度的巨大差异给密集人群计数算法带来了巨大的挑战,因此提出一种基于尺度融合的密集人群计数算法.首先对密度图构建算法进行优化,利用多个头部检测器获取稀疏人群的部分头部尺度,并用径向基差值进行补全,在人群密集区域辅之以距离自适应的人群密度图生成算法,生成更为精确的人群密度图.其次利用移动翻转瓶颈卷积模块设计尺度融合的人群密度图回归神经网络,并加入膨胀卷积模块进一步提升人体头部边缘特征提取
期刊
为解决自动织物瑕疵检测算法中,未知花色织物瑕疵检测困难的问题,提出了一种基于特征残差的色织物瑕疵检测方法.首先使用瑕疵织物图像与模板织物图像的瑕疵残差和正常无标注织物图像进行融合,生成新花色瑕疵织物样本;然后改进特征提取网络采用共享权值方法,对瑕疵织物和模板织物提取特征后计算得到特征残差;最后使用ROIAlign方法将全局上下文信息缩放到和感兴趣区域统一大小后进行特征融合,对融合特征进行瑕疵分类和
期刊
由于手持拍摄设备抖动或目标运动等原因,使得视频图像资料产生运动模糊问题,降低了人类的感知质量.针对该问题从原来如何处理得到清晰图像,到现在如何高效快捷的获得清晰图像,提出了一种基于轻量级GAN(Generative Adversarial Network)的实时视频图像去模糊新模型.该模型通过定义PatchGAN作为判别网络,并在其基础上设置了全局图像和局部特征的双尺度判别器;生成网络以轻量级Mo
期刊
教师在课堂上讲课时,学生对知识点的掌握程度都反应在他们的面部表情中,教师通常通过他们的表情判断出他们对知识点的理解程度,从而调整教学进度.但是课堂教学中一个班级至少有30多个学生,而教师在课堂中讲课不可能时时刻刻照顾到每个学生.这样造成了教师不能有效地了解每个学生对知识点的掌握程度,影响教学质量.为了解决这个问题,文章提出了基于面部表情识别的课堂教学反馈系统,它能分析课堂上每个学生的面部表情,从他
期刊
针对细粒度图像分类任务中难以对图中具有鉴别性对象进行有效学习的问题,本文提出了一种基于注意力机制的弱监督细粒度图像分类算法.该算法能有效定位和识别细粒度图像中语义敏感特征.首先在经典卷积神经网络的基础上通过线性融合特征得到对象整体信息的表达,然后通过视觉注意力机制进一步提取特征中具有鉴别性的细节部分,获得更完善的细粒度特征表达.所提算法实现了线性融合和注意力机制的结合,可看作是多网络分支合作训练共
期刊
针对行人检测中HOG特征提取速度慢且易忽视细节特征的问题,提出了一种Gabor特征结合快速HOG特征的行人检测算法.首先对输入图像进行小波变换,并引入积分图思想和主成分分析算法快速提取图像HOG特征;其次融合Gabor小波变换得到的Gabor特征,最后采用混合特征训练分类器,实现行人的有效检测.测试集上的实验结果表明,在使用相同分类器的情况下,该混合特征提取方法比单一特征提取方法的检测正确率最多可
期刊
随着摄像头的普及,基于人工智能的行为分析技术在智能视频领域扮演着越来越重要的角色.现有的算法大多采用光流网络或者3D网络来获取行为的时间信息,但是光流网络和一般的3D网络计算量大,在同时进行分类和定位这两项任务时计算效率低.针对这一问题,本文构建了一个能够进行空间定位和分类的双流框架,在3D网络分支中采用SVD的思想分解3D卷积核以减少3D网络的参数,并利用动态规划算法高效的搜索最佳行为管道,在训
期刊
本文针对医学脊柱CT图像因骨密度不均匀、骨骼结构复杂或图像成像分辨率低等因素造成的分割精度较低的问题,提出一种基于卷积-反卷积神经网络的CT图像脊柱分割方法.通过引入多尺度残差模块及注意力机制改进U-Net网络,训练特征模型并进行测试.在真实数据集上的实验结果表明,该方法能有效提高CT图像中脊柱的分割精度及分割效率, Dice系数评估值为0.97, IOU系数评估值为0.94.
期刊