论文部分内容阅读
基于视频的行人检测与跟踪是计算机视觉研究领域的关键问题之一,随着它在人机交互、智能驾驶和视频监控等领域的广泛运用,近年来成了研究的前沿方向和热点。尽管许多国内外的学者针对该领域取得了大量的研究成果,但对于复杂场景下的行人检测与跟踪,仍然有许多关键的问题有待进一步的研究。本文的研究工作围绕这些问题开展,主要内容如下:1.针对视频中的行人因形变而造成的漏检问题,研究了一种通过划分形变区域并对通道特征进行金字塔池化的形变金字塔聚合通道特征,能有效的降低了漏检率,显著提升了行人检测器的性能。此外,针对视频中行人检测器的后期的检测窗口融合之后会遗留较小的误检窗口的问题,研究了一种融合时间信息和尺度比信息的非极大值抑制窗融合算法,显著的降低了遗留误检窗口数。2.针对视频中基于检测的多人跟踪算法由于行人被遮挡而产生的轨迹断裂和误匹配问题,分析了基于检测的在线多人跟踪算法框架,研究了一种基于轨迹置信度的在线双层关联的多人跟踪算法,并结合改进的在线学习的相似度模型,有效提高行人被短时间遮挡时跟踪的鲁棒性,提高了多人跟踪算法的准确率。3.设计了一个完整的行人检测与跟踪系统,讨论了系统中的几个重要步骤,包括训练行人检测器时训练正样本的截取方式,多轮训练策略,以及行人检测模型的评估和多人跟踪算法的评估方法;基于MATLAB GUI技术设计了一个行人检测与跟踪系统的实验平台,该系统有数据标注,行人检测器的训练,行人检测与跟踪算法的评估和演示功能。