【摘 要】
:
三维人体姿态识别是计算机视觉领域一个非常重要的问题,也是智能人机交互领域的核心技术之一。近年来,人体姿态识别技术发展迅速,二维人体姿态识别准确度不断提升,为三维人体姿态识别提供了新的可能。几何模型在三维计算机视觉领域具有两个主要内涵:其一是相机与成像关系的几何模型,其二是观测目标的几何模型。对于相机视角而言,现有的三维人体姿态数据集相机视角多样性有限,现有方法容易陷入视角耦合的困境,因此需要在流程
论文部分内容阅读
三维人体姿态识别是计算机视觉领域一个非常重要的问题,也是智能人机交互领域的核心技术之一。近年来,人体姿态识别技术发展迅速,二维人体姿态识别准确度不断提升,为三维人体姿态识别提供了新的可能。几何模型在三维计算机视觉领域具有两个主要内涵:其一是相机与成像关系的几何模型,其二是观测目标的几何模型。对于相机视角而言,现有的三维人体姿态数据集相机视角多样性有限,现有方法容易陷入视角耦合的困境,因此需要在流程设计与模型训练过程中考虑针对相机几何泛化的数据增强。对于观测目标–人体而言,三维人体姿态识别的应关注方向除了人体在三维空间中的姿态,还应包含三维人体的形状、材质、光照和纹理信息;然而传统的基于关键点-骨骼模型的三维人体表示方法无法准确编码人体的形状信息,因此具有姿态和形状协同信息的复合人体几何表达应运而生。本文就相机几何问题设计了一套完整的视角增强方法,并提出了一个基于虚拟舞蹈动作的数据集用于二维-三维关键点回归问题的训练与评估方法;就三维人体几何表示问题提出了一种基于椭球体人体表示方法的几何模型和端到端解决方案,作为一种基于回归模型和后处理优化算法的方案,利用可微分渲染和人体图像分割标注,较好的解决了因肢体部分自遮挡造成的多值歧义问题,提高了三维人体姿态估计和部分级别语义分割预测的准确性,同时为常用的三维人体姿态参数化模型提供了一种灵活轻量的中间表示方法。
其他文献
人脸表情识别作为人脸识别中的关键一环,在自动化人脸分析的研究领域中不可或缺。基于人脸表情识别技术的市场正在蓬勃发展,在人机交互、社交网络建模、智慧医疗、智能通信、自动驾驶等领域,人脸表情识别技术已经成功转化为市场认可的产品或服务。更多的应用场景也在探索中,其中,教育领域是一个尚未充分开发的潜在应用场景。对于计算机而言,人脸表情识别任务通常就是将图像或者视频帧分类到诸如生气、恶心、害怕、开心、伤心、
目标检测算法是计算机视觉中非常关键的技术,并且它作为基础算法被用在相当多的应用场景和研究领域中。在本篇论文中,我们提出了一种创新性的目标检测器训练方法。由于一阶目标检测器的训练通常是同时优化分类损失函数和位置损失函数,前者由于锚点数量大而导致了极端的前景-背景类不平衡问题。本文提出了一种新颖的框架,用排序任务代替一阶目标检测器中的分类任务,并采用平均精度损失函数(AP-loss)来作为排序任务的目
多实例多标记学习在生物医学图像领域的是广泛存在的,探索解决这一类问题的通用解决方案具有重大意义。我们选取了基于免疫组织化学图像进行亚细胞定位问题以及对果蝇胚胎发育图像自动注释问题进行了探讨,期望我们的方案能对解决其它生物医学场景的多实例多标记学习问题提供参考。人类蛋白质图谱(HPA)中的组织图谱包含免疫组织化学(IHC)图像,其通过可视化的方式展示了从组织水平到细胞水平的蛋白质分布,这为研究人类空
近年来,随着医学与计算机科学的不断发展,医疗方案的相关推荐方法得到了越来越多的的关注。将人工智能的相关算法应用于医疗方案的推荐上,势必能改善医学诊断,并辅助医生做出更好的诊断,以造福人类。文章紧密围绕医疗方案推荐算法及其应用这一话题展开讨论,研究提升推荐准确性和加快推荐速度的方法。首先,文章介绍了基于知识的医疗方案推荐方法以及基于案例的医疗方案推荐方法。这两种方法被作为文章研究的基础。针对基于知识
高职院校在生源扩招和师资扩充的背景下,针对师德师风建设过程中存在的教师党支部建设弱化、引领师德师风作用不强;教师法治意识需要完善、规则意识有待增强;师德师风建设长效机制不完善、监督引导不充分等困境,通过强化党对教师的引领,铸牢思想之魂;强化教师法治教育、纪律规范教育;建立健全师德师风建设长效机制,激发教师师德师风自我完善意识来开展高职院校师德师风建设,助力高职院校打造政治强、情怀深、思维新、视野广
随着深度学习技术的发展,计算机视觉相关技术在近些年来取得了巨大的突破,比如物体和人脸识别,物体检测以及物体分割等等。但在计算机视觉领域普遍缺乏对于关系的学习,比如物体检测当中多个物体之间的关系,人和物体交互检测时人和多个物体之间的关系,以及视频任务中帧与帧之间关系的学习。而对于特定的计算机视觉任务,关系学习可显著提升其性能。本文利用关系学习帮助视频摘要和目标重识别两个特定任务,并展示了关系学习在视
三维目标检测算法是无人驾驶系统环境感知的重要一环,在无人驾驶车辆的行为规划和决策中具有重要应用。与二维目标检测相比,以稀疏点云为输入的三维目标检测方面的工作尚未成熟。本文提出了一种新的基于点云投影的实时三维目标检测框架FVNet,它包括两个阶段:准边界框的检测和最终边界框参数的细化。本文首先将原始点云投影到柱面,生成保留丰富信息的前视特征图,然后构建了一个基于关键点估计的无锚检测网络D-Net来检
山上有一块小石头。它很快乐。清晨,玫瑰色的晨曦(xī)染红它的笑颜。夜里,它在清冷的星空下,聆(Iíng)听周边草木的呢喃(nínán)。有一天,它得到了一颗花籽。它把花籽藏(cáng)在心窝里。它对身边的三叶草说:“我就要有一朵自己的花儿啦,我希望它是紫色的,就像你开的花儿那样。”三叶草笑弯了腰:“你?你是石头。有谁听说过石头上能长出花儿来?”
关于时空轨迹的查询的研究已经进行了数十年。然而,如何测量轨迹的相似性,以及如何有效地表示和索引轨迹仍然是个问题。对于第一个问题,我们讨论了插值不变性的性质,并提出了具有该性质的两种距离。对于第二个问题,我们提出了Trajectory Representing and Indexing(TRI)框架来管理时空轨迹。在这种框架下,首先,轨迹将根据我们的成本估算函数被切分为子轨迹;其次,子轨迹将由一种新
区块链技术是近年来的一个新兴技术与前沿热点,其中区块链隐私保护机制是一个研究热点。传统的区块链只实现了最简单的假名性,不能满足区块链用户日益增长的隐私需求。为了解决这一问题,多种区块链隐私保护机制被提出,比如混币机制、环签名机制、零知识证明机制等。基于环签名的区块链隐私保护机制是其中很重要的一种机制,它通过引入混合地址与真实输入一起形成一个环,然后生成环签名将真实输入隐藏起来。基于环签名的区块链隐