基于骨架的人体行为识别

来源 :浙江大学 | 被引量 : 0次 | 上传用户:guawang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
特征的表达和融合是计算机视觉算法中的两个重要部分。例如,在基于骨架的人体行为识别中,如何表达三维骨架的几何关系对于行为识别效果有至关重要的影响。然而很多现有的研究都主要关注时序建模和识别流程的改进,而非特征的设计。另一方面,融合不同网络的输出对于识别的精度同样能有提升。而现有的融合深度网络的方法缺乏对于不同输出分布的考虑。  本文分为两部分。在第一部分中,我们总结了近年来基于递归神经网络的人体骨架行为识别的发展脉络,并推测出使用关节点间关系的建模可以获得更好的性能。根据这种直觉,我们设计了八种几何关系特征并用一个三层的LSTM网络分别评估了其性能。进一步的实验表明基于点线距离的几何特征要比其他的特征效果好,并在四个公开数据集中均取得了当前最好的结果。此外,实验还表明,只使用一小部分的点线距离就可以达到与使用全部点线距离相近的结果;并且使用点线距离作为输入,相较于点坐标,只需要较小部分的样本作为训练数据。  在第二部分中,我们研究了常用的融合方法,发现在训练过程中不同模型之间的信息交换对于最终的结果有负面的影响。而另一方面,简单的分数平均忽略了不同分类模型输出的概率分布平滑程度不同,对结果的贡献也不尽相同。基于这两点原因,我们提出了一个平滑的分数融合的方法。该方法首先平滑各网络输出的得分,并自适应地学习出各个网络的权重。我们的模型相较于许多精心设计的LSTM网络结构要简单很多,但仍在四个广泛使用的公开数据集中均获得了当前最好的结果。此外,我们也用实验展示出模型在关节点丢失和关节点有噪声情况下的鲁棒性。
其他文献
获取操作系统运行时的实时信息,监测并记录系统运行时的状态是十分重要的。一方面,这些信息是系统性能监测和调优(tuning)、内核剖面(profiling)、应用程序执行追踪(tracing)以
在开发大规模分布式应用的过程中,如何有效地集成和共享已有的软件和本地计算,提高系统的开发效率,降低系统的开发成本一直是分布式系统研究和关注的重点问题。为了解决这一问题
我国税务机关的个体税收征管,传统上是由税务人员主观评定纳税额。存在人为参与因素多、规范不细,不利于具体问题具体分析,规范的变化缓慢,不能适应市场经济发展的需要,严重制约着
Internet高速发展使人们越来越依赖于通过互联网获取各种信息,CNNIC的最新报告显示互联网第一入口是即时通信的比例是39.7%,看新闻则以20%居第二。新闻信息本身具有数量大、增长
随着经济活动的不断发展,人们对道路交通系统的依赖越来越强,交通拥堵(trafficcongestion)成为世界各大城市面临的严峻问题。近年来智能交通系统(IntelligentTrafficSystem,ITS)
细分曲面作为一种几何外形表示方法,具有交互直观、整体光滑、任意拓扑等优势,在影视特效、三维游戏和数字媒体内容创作等行业中得到了广泛的应用。细分曲面是递归定义的,这与当
如今,软件系统的复杂度越来越大,而对软件系统的可靠性、时效性的要求也越来越高。如何在保证软件产品质量的前提下有效控制产品的开发和维护成本,是企业提升市场竞争力的关键。
如今,随着计算机和互联网的蓬勃发展,给人类的生活带来了革命性的变化。而不论是计算机基础应用还是互联网,表示和查找已经成为大多数计算机应用的核心。BloomFilter是一种空间
近年来,随着传感器网络和RFID技术的发展,基于数据流的应用已经无所不在。数据流上的应用大多是监控型的,并且这些监控任务一般是简单事件的组合,但简单的数据流管理系统(DSMS)一
随着定位技术的普及和无线传输技术的发展,大量轨迹数据正以各种方式快速产生和收集起来,并被广泛用于基于位置的服务(LBS)、无人驾驶、动物行为研究、气象预测和城市规划等领