基于改进特征金字塔网络的人体姿态估计

来源 :计算机工程 | 被引量 : 0次 | 上传用户:cheer4you
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为在人体姿态估计过程中有效获取多尺度特征和关键点坐标,建立一种基于改进特征金字塔网络(IPFN)的人体姿态跟踪模型。在原特征金字塔上采用新的检测器扩大感受野得到新特征金字塔,通过引入多尺度卷积生成高斯热点图,同时搜索和定位关键点,使坐标转换层将高斯热点图转为坐标,实现端到端训练过程。实验结果表明,相比FPN,IPFN模型在MPII数据集的PCKh和COCO数据集的AP上分别提高了2.05和3.20个百分比;在踝、膝、腕和肘4个难检测部位上的PCKh分别提高了3.95、2.80、2.52和2.05个百分点。
其他文献
以2015年以来的《Gartner数据科学平台魔力象限系列年度报告》为线索,分析调研35种数据科学平台产品,提出数据科学平台的定义和类型。数据科学平台相关学术研究中的主要科学问题涉及数据科学平台的设计、数据科学平台的可扩展性、基于数据湖的数据科学平台研发、数据科学平台的支持团队协作能力、数据科学平台的开放策略以及数据科学平台工程方法论。数据科学平台的主要特征包括模块化开发及集成能力、开发运维一体化、重视可扩展性、强调用户体验、重视非专业级数据科学家以及重视人机协同场景;数据科学平台的实现需要的关键技术为机
针对无线传感器网络基站位置隐私保护问题,提出一种基于垂线的基站位置隐私保护算法。根据源节点的位置与坐标轴上一点随机确定一条直线,过基站做直线的垂线,源节点关于该垂线对称的点为第1个预期幻影源节点,使第1个幻影源节点分布具有地理位置多样性。以第1个预期幻影源节点为垂足建立垂线,在该垂线上确定第2个预期幻影源节点,为第2个幻影源节点提供选择方向,2个幻影源节点不仅能够为数据包传输提供多样性,而且分别沿着直线和垂线传输假包,诱导攻击者向远离基站的方向追踪,增大攻击者捕获基站的难度。仿真结果表明,该算法能够有效地
由于毫米波网络具有间歇性及较高的路径损耗,对于毫米波与微波基站联合组网系统,传统的小区关联方法会导致严重的负载失衡问题。为此,提出一种分布式双连接小区关联算法。该算法基于效用函数,采用匹配算法求解系统效用最大化下的最优关联,并保证产生帕累托最优和双向稳定解。同时为基站设置最小配额约束,以平衡毫米波与微波基站负载。此外,在匹配算法基础上选择边缘用户进行双连接,减少干扰并降低频繁切换导致的链路失误率。仿真结果表明,最小配额分配算法下全网和速率较传统最大信干噪比算法平均提升25.9%,双连接时全网和速率较单连接
针对现有疲劳驾驶检测技术不能有效平衡准确性和实时性的问题,通过融合人眼特征与深度学习,构建一种新的疲劳驾驶检测模型。设计GP-VGG16网络进行眼部状态识别,通过将人工先验信息集成到轻量级深度网络中,提高眼部状态识别的准确性、稳定性和实时性。在此基础上,利用眼部特征-疲劳等级模型将疲劳状态划分为9个等级,定量估计驾驶员状态,同时基于少样本学习建立高效的自动标签生成网络,减少对大量无标签驾驶数据的语
文本表示的高维性会增加文本分类时的计算复杂度。针对该问题,构建基于类邻域字典的线性回归分类模型。采用K近邻方法构造各类别的类邻域字典,根据对测试样本的不同表示,分别提出基于级联类邻域字典和基于类邻域字典的线性回归分类算法。此外,为缓解噪声数据对分类性能的影响,通过度量测试样本与各个类别之间的相关度裁剪噪声类数据。实验结果表明,该模型对长文本和短文本均能够得到较高的分类精度和计算效率,同时,噪声类裁剪策略使其对包含较多类别数的文本语料也具有较好的分类性能。
将卷积神经网络引入生成对抗网络可提高所生成图像的质量,但网络的感受野较小且难以学习各个特征通道之间的重要关系。在SinGAN网络的基础上,提出一种能从单幅图像中学习的生成对抗网络模型。在SinGAN网络的生成器和鉴别器中引入Inception V2模块以增加网络宽度扩大感受野,采用多个卷积核提取图像特征并进行特征融合,利用SENet模块学习各个通道的重要程度以获取更好的图像表征。实验结果表明,与B
服饰文化是京族传统文化的重要组成部分.经过创新之后,女性服饰形成了修身、窄袖等结构,能够凸显女性身材,而男性服饰则大多是及膝长衣.广西京族的传统服饰经历了两个发展阶
针对高铁环境中包含多个主用户的主服务和多个次用户的频谱分配问题,提出一种认知博弈频谱共享算法。引入次用户优先级和用户传输业务等级,满足不同优先级用户的不同业务频谱使用需求,并根据主基站和次用户的距离变化更新主服务向次用户提出的价格函数,获得静态博弈下的纳什均衡解,同时分析不完全信息和完全信息的动态博弈,确定不完全信息动态博弈的稳定区间。分别对静态博弈和动态博弈进行仿真,结果表明,在该算法下,当次用户优先级相同时,不同业务等级租借不同的带宽,业务等级越高,租借的带宽也越多,随着距离的变化,较高的业务等级频谱
现有用于软体驱动器角度测量的接触式传感器主要包括惯性传感器与曲率传感器,但惯性传感器的测量精度易受软体驱动器内嵌气道膨胀的影响,曲率传感器测量则存在迟滞和漂移等问题。为进一步提高接触式传感器测量软体驱动器角度的准确性,结合模糊推理与卡尔曼滤波结合的算法实现惯性传感器和曲率传感器数据融合。基于BP神经网络和长短时记忆网络分别融合曲率传感器和惯性传感器,减少接触式传感器测量软体驱动器角度时迟滞和气道膨
安全代理被越来越多的互联网用户用于规避网络审查和访问受限资源,因此安全代理流量的分类对于网络安全和网络管理具有重要意义。为弥补深度包检测技术在过滤和识别不良信息上的不足,提高防火墙流量探测能力,提出一种安全代理流量分类方法。提取用于安全代理流量分类的侧信道特征,包括有效载荷长度序列、信号序列等,使用机器学习和深度学习算法对Shadowsocks、V2Ray、Freegate、Ultrasurf 4种被广泛使用的安全代理流量进行识别。实验结果表明,通过提取与有效载荷内容无关的侧信道特征进行分类,与MLP、L