多尺度高分辨率保持和视角不变的手姿态估计

来源 :计算机工程与应用 | 被引量 : 1次 | 上传用户:jiushizhegehao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前基于彩色图像的手姿态2D关键点热图估计大多数采用卷积姿势机或沙漏网络进行,但这两种网络不能同时满足高分辨率表示保持学习和多尺度特征融合。针对该问题引用了一种多尺度高分辨率保持的网络,该网络采用高低分辨率表示并行设计的结构,并通过融合所有分辨率表示增强各分辨率表示的特征,而且拥有多个阶段提取高质量特征用于2D热图估计。为得到3D手姿态,还使用了全局旋转视角不变的方法将2D热图映射到3D姿态。在三个公开数据集(RHD、STB、Dexter+Object)上分别对2D手姿态估计和3D手姿态估计进行了实
其他文献
针对现有查询响应时间预测统计模型存在准确率无法提高、特征选取单一、动态性差的问题,综合考虑查询计划、查询交互两大因素,提出采用结构简单、易搭建的人工神经网络——全连接神经网络预测并行查询响应时间。采集查询计划与查询交互数据作为输入特征,查询真实的响应时间作为预测标签,训练模型,进行预测。此方法不需要预先知道样本数据的数学模型函数,仅通过对样本数据集的学习建立模型,建模过程简单,可达较好的预测效果。实验结果表明,全连接神经网络模型准确率高达79.99%,较当前代表性的统计模型提高约6%。
为了实现大型语料库中近义词/同义词短语的查找,提出了一种基于共同语境的近义词/同义词短语查找模型,它通过n-gram分布式方法捕获语义相似性,不需要解析就能隐式地保存局部句法结构,使底层方法语言独立;具体实现分为两个阶段:第一阶段是上下文收集和过滤,即用围绕查询短语的本地上下文作为条件模型的特征来捕获语义和语法信息。第二阶段是候选词短语收集和筛选,即对数据中的每个“左”“右”和“配对”的全部实例进行迭代,以收集一组近义词/同义词候选短语;还给出了构成模型的要素和用于评价模型性能的评分函数;基于不同大型语料
相变存储器具有集成度高、功耗低、非易失等优良特性,是作为非易失性内存最有潜力的存储介质之一。如何降低其写入延时和增加其使用寿命,是PCM作为非易失性内存时亟需解决的问题。为此,提出利用相变存储器擦除和写入时间不对称的特点擦写独立的写入方法,RSIW(ResetandSetIndependentlyWrite)。该方法不同于传统的写入方案,将写和擦的操作分离,让慢速的写操作在空闲时进行,使得相变存储器的写入速度获得显著提升。同时,RSIW还能结合磨损均衡的策略,有效地均衡各个块的写入频率。对擦写独立的写入方
涂层织物在生产制造和使用中易产生折皱损伤,人工折皱检测效率较低,传统图像处理方法的检测精度无法满足要求。提出一种基于深度卷积神经网络的涂层织物折皱识别和检测方法。通过标准揉搓试验建立数据集,网络编码和解码器分别采用多尺度特征融合结构和优化上采样模块,使用形态学方法进行折皱几何信息的实时统计。当前检测方法准确率达到95.78%,比传统语义分割技术及其他深度学习模型有很大的提升。
不同的控制参数设定和生成策略(交叉和变异)都会对多目标差分进化算法的性能产生显著影响。为实现其控制参数和变异策略的实时自适应调整,提出一种基于隐马尔可夫链的自适应多目标差分进化算法。该算法利用隐马尔可夫模型对种群信息进行分析并得到最优序列,通过最优序列与实际状态序列的对比得出变异缩放因子F与交叉概率CR的最大似然估计值,从而实现控制参数的自适应调整;同时,通过隐马尔可夫模型得到一组策略链来辅助多目标差分进化算法来选择合适的变异策略。通过与其他9种多目标进化算法在16个测试函数上的对比研究,结果表明所提算法
针对传统长短时记忆网络(LongShort-TermMemory,LSTM)和卷积神经网络(ConvolutionNeuralNetwork,CNN)在提取特征时无法体现每个词语在文本中重要程度的问题,提出一种基于LSTM-Attention与CNN混合模型的文本分类方法。使用CNN提取文本局部信息,进而整合出全文语义;用LSTM提取文本上下文特征,在LSTM之后加入注意力机制(Attention)提取输出信息的注意力分值;将LSTM-Attention的输出与CNN的输出进行融合,实现了有效提取文本特征
在聚类研究中,通常认为数据集的对象、属性等方面是满足独立同分布的,它们之间是互不影响的,然而实际上它们之间存在着某些潜在的联系,即非独立同分布。为了更好地挖掘其存在的潜在关系,将数据集进行二次幂处理,计算皮尔森相关系数后得到二次幂耦合的数据集样本,为了解决K-means聚类算法存在选取初始中心点的敏感性问题,基于密度的思想,通过计算密度参数合理调整高密度区域,利用聚类迭代的方法进行选点,将高密度区域中的密度最大点作为初始点,距离初始点最远点作为第二个点,以前两个点为中心聚类迭代得到两个质心,将距离两个质心
针对动态复杂场景下的操作动作识别,提出一种基于手势特征融合的动作识别框架,该框架主要包含RGB视频特征提取模块、手势特征提取模块与动作分类模块。其中RGB视频特征提取模块主要使用I3D网络提取RGB视频的时间和空间特征;手势特征提取模块利用Mask R-CNN网络提取操作者手势特征;动作分类模块融合上述特征,并输入到分类器中进行分类。在EPIC-Kitchens数据集上,提出的方法识别抓取手势的准
域名生成算法(DGA)存在变化多、部分类别样本难获取的特点,使得采用传统机器学习的恶意域名检测模型准确性不高。提出一种基于迁移学习和多核CNN的小样本DGA恶意域名检测模型。该模型将目标域名映射到向量空间中,使用样本充足的DGA种类进行预训练,并迁移预训练得到的参数到小样本检测模型。采用多核CNN小样本分类模型根据发音习惯进行域名特征提取并分类。通过实验对比发现,无知识迁移的小样本分类模型只有11类域名准确率超过92%,经过迁移学习的多核CNN模型20类准确率超过92%,11类准确率超过97%,检测效果接
在现实世界中,可用的训练数据通常较少,且很容易过时,所以需要不断采集和标记大量新的数据集;针对此问题,提出一种基于SAMME和TrAdaBoost算法的迁移学习分类方法。该方法的核心思想是:从老视频流数据集中筛选出有用的样本来帮助模型识别新的未知视频流集样本,这里新老视频流数据集的样本特征分布是不相同的。同时该方法结合SAMME算法将TrAdaBoost算法从只可实现两分类扩展至多分类。实验结果表