视频监控中行人检测与跟踪关键技术研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:leobear
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频监控系统中的行人检测与跟踪是计算机视觉领域中一个活跃的研究课题,是进行个体识别、行为分析理解、异常事件检测等技术的基础,在交通、商业、军事和公共安全等领域具有重要的应用价值。  行人检测的目的是把视频序列中出现的所有行人从背景和其他目标分离出来并进行准确的定位。为了得到更好的召回率,目前主流的方法大多采用基于滑动窗口的方法来进行候选窗口的定位,然后再利用大规模标注的训练数据训练好的模型进行分类。然而此类方法一方面会产生过多冗余的负例窗口,使得分类检测的计算量大、速度慢、准确性低;另一方面由于数据分布的不一致,在源域中利用大量标注数据训练好的模型难以在新的目标域场景中得到好的分类效果。行人跟踪的目的是在视频序列中找到目标行人的位置,推测其身份,计算其运动轨迹,并在整个视频序列中维持其身份不变。许多多目标跟踪的方法都采用基于检测的跟踪框架。该类方法首先采用检测算法对视频的每一帧图像进行行人检测,然后利用相似性度量模型对检测结果和跟踪目标之间进行相似性度量,再利用关联优化算法对检测结果进行目标的关联。这种框架在自动处理复杂环境下的多目标跟踪问题时具有很好的效果。然而现有的方法在构造相似性度量模型时要么依赖于离线标注数据,费时费力;要么需要当前帧的后续帧信息,无法进行在线跟踪;要么在处理相似目标交互时,效果不好。  针对现有方法存在的问题,本文在快速准确的行人定位检测、无标注数据的目标域模型训练和在线多目标跟踪算法中的相似性度量模型的定义等关键问题上展开了较为深入的研究,取得了如下研究成果:  (1)基于滑动窗口过滤的快速行人定位  针对行人定位检测时产生过多冗余的负例窗口导致分类检测速度慢的问题,本文将背景建模与滑动窗口两种技术进行了有效的融合,提出了一种基于滑动窗口过滤的快速行人定位方法。首先,通过利用视频的时空关系,提出采用快速的前景提取技术提取前景像素;然后,利用包含空间关系的聚类技术和过滤的方法从前景像素中构造出子窗口;再利用运动信息、历史检测信息和位置信息对每个子窗口采用自适应的尺度空间和自适应的步进空间产生少量的定位窗口;最后再提取每个子窗口的特征,采用训练好的模型进行分类检测。该方法针对滑动窗口从空间、尺度和步进上进行了有效的过滤,大大减少了冗余的错误窗口的产生。实验表明,该方法在保证召回率的情况下,能有效的提高行人检测的速度和准确率,更重要的是,该方法在两个测试数据集上的测试速度接近于实时。  (2)基于稀疏编码和迁移学习的行人检测  针对基于大规模标注的训练数据训练的模型存在难以推广的问题,本文提出了一种基于稀疏编码和迁移学习的行人分类检测方法。该方法首先利用视频的特性构造多个滤波器,并采用帧内聚类和帧间聚类技术从目标域场景中自动选择少量模板数据;然后利用稀疏编码来分析源域标注数据和目标域无标注数据之间的关系;结合样例迁移的跨域迁移学习方法,利用源域标注数据在目标域场景中实现了无标注数据的模型训练,有效的解决了模型推广难的问题。实验证明,该方法能有效提高目标域场景中无标注训练数据模型的检测率,其结果与人工标注方法训练的模型进行检测的结果接近,与现有的方法相比,在相同的准确率的情况下,召回率提高了约10%。  (3)基于局部块相似性度量模型的在线多行人跟踪  针对在线多目标跟踪方法中缺乏鲁棒的、无标注数据的相似性度量模型的问题,本文提出了一种基于局部块相似性度量模型的在线多行人跟踪方法。该方法提出了行人局部块的区分性和代表性能力的概念,并采用无监督的在线学习方法学习每个局部块的区分性和代表性的能力。在此基础上,采用基于局部块的受限空间匹配和能力带权投票的策略定义外观模型,这使得模型在没有标注数据的情况下,对目标之间,特别是相似目标之间具有更强的区分性和鲁棒性。最后再结合运动模型、尺度模型和时间模型提出了一种基于局部块的相似性度量模型。实验结果表明,该方法能有效的提高在线多行人跟踪的准确性。与其他方法相比,该方法无需标注训练数据,能进行在线的多目标跟踪,而且在处理相似目标交互时具有更好的区分能力。
其他文献
在大规模数据处理中,文件系统是非常重要的环节之一。文件系统的性能直接影响到应用的性能和处理效率。随着高性能和分布式计算架构的发展,并行文件系统受到了越来越多的关注
学位
近十年来,多核、众核体系结构逐渐成为主流,如何充分利用多核、众核体系结构上丰富的计算资源成为学术界和工业界研究的热点。异步的任务图并行能发掘应用中更多的并行性而受到
传统的软件都是针对某个用户单独定制,无法同时为多个用户提供服务。SaaS是一种具有多租赁性的软件运营模式,在这种模式下同一套软件将可以同时出租给多个租户使用,租户间的数据
搜索引擎的出现使人们获取信息的效率大大提高,怎样从海量的搜索结果中将用户最关心、最需要的信息排在返回列表的最前面,即搜索结果的排序问题是信息检索领域研究的关键问题
该文在软件体系结构的指导下,对MIS进行了三层调查.在系统层抽象中对现有的两层C/S结构和三层C/S结构进行了分析;然后将着重点放到对功能层的抽象上,分析了现有的对功能层的
该课题研究了一种基于几何约束的二维参数化设计的方法,是一种将基于构造过种的方法和变量几何法相结合的机制.通过记录构图过种中几何图素的生成过程的先后顺及连接关系,在
为了满足科学计算和商业应用日益增长的规模需求,计算机系统规模不断扩大。在现今的超算中心或数据中心,高性能互连网络需要互连高达数万甚至数十万个节点。作为计算机系统的传
计算机软件技术极大的促进了社会的信息化进程,从个人移动计算到企业云计算,丰富的软件生态为我们的生产生活提供了极大的便利。但是,在提供便利性的同时,计算机软件系统潜在
图像中的文本蕴含丰富的语义信息,这些信息是图像内容描述和场景理解的关键线索,对于图像检索、信息检测、场景分析和智能控制等应用有着巨大价值。同时,智能手机、数码相机等具