基于稀疏表示的在线目标跟踪研究

来源 :上海交通大学 | 被引量 : 11次 | 上传用户:jettey
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标跟踪的主要目的是获得目标在视频或者图像序列中每一时刻的运动状态,包括位置、大小等,进而获得其在整段视频中的运动轨迹。作为图像(视频)处理和模式识别领域的重要研究课题,目标跟踪具有广阔的应用前景。自问题提出以来,一系列方法相继出现,但仍然面临诸多困难,尤其是光照变化、遮挡、尺度变化、场景混乱、姿态变化、图像模糊和剧烈运动等因素对目标外观的影响,已成为制约其在实际中进一步应用的关键。近年来,在线目标跟踪(Online Object Tracking,OOT)逐渐成为目标跟踪领域的研究热点,该类方法试图根据目标的外观变化对跟踪器进行自适应地调整与更新,在解决上述问题方面取得了更为令人满意的效果。其中,随着近年来信号稀疏表示、凸优化理论以及压缩感知的发展,利用信号稀疏性进行目标跟踪的方法获得了广泛的关注。为此,本文针对目标在场景中外观变化情况下的跟踪鲁棒性问题,以目标跟踪为研究对象,以外观变化场景下基于稀疏表示理论的在线目标跟踪为目标展开研究。主要工作和创新点如下:(1)基于稀疏表示理论,本文提出了一种基于选择性稀疏外观模型和时空分析的生成性在线跟踪方法。首先,本文构建选择性稀疏外观模型,该模型将目标区域分割为相互重叠的图像块,利用关键点比例排序(Key Point Proportion Ranking,KPPR)算法构建目标区域的局部重要性评价,以最重要的部分图像块为关键块代表目标。然后,方法构建了基于时空分析的跟踪处理过程。对选择后的图像关键块进行基于Elastic Net正则化的时域加权稀疏表示,通过时空统计推断的分析方法,完成目标在当前时刻的位置估计。在运动建模部分,本文基于联合高斯分布假设和针对过去时刻跟踪信息的处理近似,构建了一种递推式的仿射运动模型;在观测建模部分,本文采用稀疏表示系数核加权迹的lp范数计算目标候选样本的置信度,并构建置信度-坐标空间(Confidence-Coordinate Space,CCS),然后通过较大置信度候选样本在该空间内的推演实现当前帧目标位置,使得目标位置的估计相对更为灵活,但不失鲁棒。该跟踪方法在本文构建的由16段典型测试序列组成的基准集合进行了测评实验,在其中14段序列实现了较为稳定和鲁棒的跟踪,12段序列平均中心误差在10像素以下,平均覆盖率综合达到了66.8%,其中1段测试序列对应的平均中心误差和平均覆盖率在全文24种跟踪方法测评对比中排名最优。实验的主客观分析结果表明,与经典的在线目标跟踪方法相比,本文所提出的生成性方法在跟踪准确率方面更具优势。(2)针对本文所提生成性跟踪方法存在的跟踪器易受周围环境负面影响的问题,结合稀疏表示理论中的字典学习问题,本文提出了一种基于增量结构化字典学习的判别性在线跟踪方法(Incremental Discriminative Structured Dictionary Learning for Visual Tracking,IDSDL-VT)。首先,本文构建了一种增量判别性结构化字典学习(Incremental Discriminative Structured Dictionary Learning,IDSDL)算法。该算法构建与正负样本图像块对应的判别性字典,并通过局部更新(Local Update,LU)机制实现对字典的在线逐列更新,这填补了通过稀疏表示构建分类模型的跟踪方法未使用结构化字典学习的空白。然后,本文采用学习后的字典以Elastic Net为正则项进行稀疏表示,将表示系数作为特征通过K-组合投票(K-Combined Voting,KCV)方式进行分类器的训练与判决,选取置信度投票最大值对应的样本作为当前帧的跟踪结果。上述过程随着时间推移重复进行,从而实现了字典的增量化更新和目标的连续化跟踪。该跟踪方法在基准集合进行了测评实验,在其中14段序列实现了较为稳定和鲁棒的跟踪,13段序列平均中心误差在10像素以下,平均覆盖率综合达到了67.3%,其中3段测试序列对应的平均中心误差和平均覆盖率在24种跟踪方法测评对比中排名最优。实验的主客观分析结果表明,IDSDL-VT有效解决了论文所提生成性跟踪方法的问题;与经典的在线目标跟踪方法相比,在跟踪精度和鲁棒性方面均取得更为令人满意的表现。(3)为了解决本文所提判别性跟踪方法存在的单次迭代字典学习效果差的问题,同时提高其应用普适性,结合在生成性和判别性跟踪方法方面所取得的成果,本文提出了一种混合性在线跟踪该方法:基于增量选择性稀疏模型和残差加权在线字典学习的在线跟踪方法。该方法首先将选择性稀疏模型、字典学习、分类模型训练与更新进行整合,构建了混合增量稀疏模型(Hybrid Incremental Sparse Model,HISM),将目标跟踪处理流程切分为生成性建模和判别性建模两部分。在生成性建模部分,采用基于稀疏表示的增量时空贡献一致性排序(Sparsity-based Spatial-temporal Contribution Ranking,ISSt CR)的方法,进行关键块的选取,用于代表目标区域;构建了基于帧间索引差的数值调整(Number Adjustment based on Inter-frame Indices Difference,NAIID)方法实现关键块数量的自适应调整。在判别性建模部分,采用了基于关键块的字典学习和线性分类器(组)相结合的方法对候选样本进行判定,构建了残差加权在线字典学习(Residue-weighted Online Dictionary Learning,RODL)与残差加权增量判别性结构化字典学习(Residue-weighted Incremental Discriminative Structured Dictionary Learning,RIDSDL)算法,并给出了两种字典更新方式及其证明。与经典的(在线)字典学习和判别性字典学习方法的实验结果进行对比标明,新提出的加权在线字典学习方法,在迭代次数保持不变的情况下,进一步提高训练信号的信噪比,对人脸分类效果良好。该跟踪方法在基准集合进行了测评实验,与前两章跟踪结果相比,全部序列实现了相对较为稳定和鲁棒的跟踪,13段序列平均中心误差在10像素以下,平均覆盖率综合达到了71.6%,其中1段测试序列对应的平均中心误差和平均覆盖率在24种跟踪方法测评对比中排名最优。实验的主客观分析结果表明,尽管本文所提混合性方法在部分测试序列的准确性有所下降,但普适性更强,在各段测试序列的综合性表现更好;与经典的在线跟踪方法相比,同样能够获得良好的主客观评价。
其他文献
半月线疝为临床少见,极易误诊的腹外疝,临床外科医生对其缺乏足够的认识,术前误诊率较高,误诊给患者带来身心负面影响较大,以下病例分析及教训,予以提高临床医生对本病的认识及诊断
表面上看来,牙齿好像是块“死骨头”,实际上,它和人体的其他各部位一样,在不断地进行更新和修复。因此,要保持满口美齿,除了要注意口腔卫生外,还要从饮食营养上下功夫。众所周知,构成
目的:研究及比较垫枕疗法结合高粘度骨水泥椎体成形术与高粘度骨水泥椎体成形术在治疗骨质疏松性胸腰椎压缩骨折中的临床疗效和不良反应,为垫枕疗法结合高粘度骨水泥椎体成形
农业作为我国经济发展的重要基础,坚持走可持续毒展的道路具有重要的积极意义。文章首先阐述了发展农业机械化推动农业可持续发展的必要性,然后分析了我国农业机械化发展存在的
原发性腹膜后肿瘤(plimary retroperitoneal tumor,PRT):指起源于腹膜后潜在腔隙内的肿瘤,但不包括肝、十二指肠、胰、脾、肾、肾上腺、输尿管,骨骼等脏器结构的肿瘤,以及源于他处的
为世人关注的青藏铁路,准备的说法应该是"青藏铁路格尔木至萨段"(青藏铁路西宁到格尔木段已于1984年竣工,长814km),是世界上海拔最高、线路最长、自然环境条件最艰苦的高原铁
目的探讨颈侧联合正中入路在复发性结节甲状腺肿再手术中可行性及疗效。方法回顾性分析36例复发性结节性甲状腺肿颈侧联合正中入路再次手术治疗的临床资料,36例患者均暴露喉返
当遇到想不通的事情时,当心里产生心理“疙瘩”时,我们是怎么想的,为什么会想不开,应该如何考虑问题,应该怎样解开这个“疙瘩”呢?二分法思考在这样的思考模式下,事情只有“好与坏“
【目的】为山茶花科学引种和育种目标性状的选择提供参考。【方法】运用相关性分析和主成分分析法提取影响山茶花观赏性的关键因子,对28个山茶花品种进行观赏价值的综合评价
在软件工程领域,越来越多软件组织采用集成的开发模式。集成可以在不同的层次和不同的阶段来进行。集成开发模式利用复用、裁剪等手段,能快速配置生成与具体项目相关的软件制