基于RGB-D数据的多目标跟踪方法研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:gswwg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多目标跟踪问题是计算机视觉领域的一个重要问题,涉及模式识别与智能系统、传感器、图像处理、统计与机器学习等多个领域的相关技术。多目标跟踪的主要任务是对视频序列中的多个目标进行关联,并使其身份标识在序列中保持不变。经过几十年的深入研究和发展,多目标跟踪技术已在智能交通系统、智能监控系统、机器人导航、人机交互、生物医学研究等多个领域广泛应用。近十年来,随着RGB-D传感器技术的成熟,基于RGB-D数据的多目标跟踪技术取得显著进展。但是,在复杂的实际应用场景中,多目标目标跟踪仍然面临频繁的目标遮挡、剧烈的光照变化、动态背景的切换等问题与难题。有效解决这些问题与难题才能进一步提升相关应用系统的性能。本文针对复杂背景中基于RGB-D数据的多目标跟踪问题进行了深入研究,内容与成果包括:  1)针对多目标跟踪的实时性要求,提出了一种深度结构关联模型(DepthStructure Association,DSA)。模型将场景中的多目标划分到不同的深度链状结构中进行三维分析。利用整数规划中的多维数据分配问题对多目标之间的数据关联进行建模。在面对多目标跟踪过程中的遮挡问题时,链状结构利用深度值对目标匹配代价进行重新加权,使得目标在场景的不同位置更具有区分性。RGB-D数据集上的验证结果表明,DSA模型可以在交通场景的多目标跟踪问题上实现实时处理。  2)针对多目标跟踪的遮挡问题,提出了一种分层图模型(Layered GraphModel,LGM)。模型将多目标跟踪与图论中的图模型相结合,将传统的基于离散-连续的轨迹级(tracklet-level)目标关联方式,提升到层级(layer-level)。LGM利用深度数据构建目标在层内以及层间的图模型,利用目标之间的位置、运动和外形信息构造关联相似度。LGM利用自身的分层关系,在层内利用加入虚拟点的策略解决交通场景中多目标之间的复杂遮挡问题。  3)针对多目标成组运动问题,提出了一种拓扑能量最小化(Topology EnergyMinimization,TEM)模型。在多目标跟踪模型中引入行人的社会属性,利用行人组内组外的目标行人的运动相似度,进行能量形式的建模。目的是使组内的行人相似度尽可能的高,组间的行人相似度尽可能的低,并以“拓扑能量最小化”方式进行模型求解。在拓扑的变化过程中,TEM通过加入虚拟点,将被遮挡的目标通过组内位置估计进行有效定位,减少了跟踪过程中的目标丢失次数。模型还对行人目标的RGB-D特征进行了创新,提出了更适合多目标跟踪的RGB-D特征。  4)针对行人组动态变化问题,提出了一种基于动态拓扑图模型(GraphicalSocial Topology,GST)。GST模型将组内的行人看作是图中的节点元素,通过图中边的连接方式探索组内成员在行走过程中的运动的变化。模型通过离线与在线学习相结合的方式,对组的典型拓扑进行离线学习,并在在线跟踪中与行人组进行拓扑结构匹配。在组的运动过程中模型通过组的初始化、更新、合并和分裂的动态变化完成对行人组的跟踪。最后GST模型利用线性规划的方式完成组内行人的身份确认,得到目标的完整轨迹。将GST模型在RGB-D数据集和RGB数据集(MOT Benchmark)中进行测试,表明了其优越的性能。  本文还介绍了作者搭建的RGB-D数据采集平台以及在该平台上采集的多目标跟踪数据集。该数据集目前已公开,供多目标跟踪研究者使用。
其他文献
随着半导体工艺、现代集成电路技术的发展,传统的单核结构处理器难以得到更有效的发展。多核体系结构的问世,为处理器设计领域带来了更广阔的的发展空间。与此同时,在星载系统等
管道运输,在煤矿开采、石油化工及天然气等产业中具有不可替代的作用。近年来,塑料管材的应用越来越广泛,已经被大量应用于工业传输液体气体领域。目前国内外管道监测研究主要是
随着web2.0技术的普及和飞速发展,互联网数据出现了爆炸性的增长。为有效存储和管理如此大规模的数据,诸多研究机构和公司都提出了各自的数据存储方案。其中影响最大的莫过于开
近年来,随着运营商的重组以及新的竞争格局逐步形成,面对迅速发展的通讯技术、激烈竞争的市场形势、新业务不短增加,新技术不短涌现,为了满足客户更多更高的要求,提高联通运营商的
概率检索模型是动态信息检索系统的组成部分。概率检索模型的任务是计算文档集合中各个文档的相关得分,其结果是检索系统返回的文档排序的主要依据。概率模型的性能优劣直接影
富媒体资源是指以文本、图片、音频、视频、Flash及其组合为表现形式的数字化作品或素材。作为数字作品中的一种,其应用越来越广泛,由于富媒体资源具有易传播、易复制且几乎无
随着数字媒体设备的迅速发展和广泛应用,多媒体产品近年来呈现出爆炸式的增长趋势。由于在数字图像,视频处理的各个领域:采集、显示、存储、传输、压缩等都需要进行质量评价,因
近年来,随着互联网上文本数据的急剧增长,如何利用自然语言处理技术高效地对海量数据进行处理,成为人们关注的焦点。句法分析作为自然语言处理领域的基础技术,是对文本进行深入理
以Web3D为代表的虚拟现实技术,因具有浸没感、交互性和构想性等特点在医疗、军事、工业制造、教育、旅游等各领域得到了广泛应用。EAST(Experimental AdvancedSuperconducting
高阶多项式矩阵的行列式计算是符号计算中的一个重要研究课题。因其矩阵元往往是多变元高幂次多项式,故采用传统的子式展开或Gaussian消元法将带来巨大的中间表达式膨胀,从而导