复杂场景下多姿态行人检测与识别方法研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:moniter2001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人是视频监控对象的焦点,行人检测与识别也是计算机视觉研究的基础任务和关键技术之一,其广泛应用于智能视频监控、车辆辅助驾驶、人机交互等领域。论文主要针对行人检测与识别时场景复杂、摄像机是否移动、行人姿态多变、行人特征提取与融合、行人分割以及候选行人目标选取等问题进行了研究。其研究内容如下:1)在单视点固定摄像头场景下,针对背景建模耗时、检测场景复杂和背景更新时自适应差等问题,提出了一种基于局部时空域模型的核密度估计行人检测算法。在前期训练学习阶段,采用K均值聚类选择关键帧避免了信息冗余和计算量大问题;在后期背景更新阶段,构建一种局部时空域模型,在时间域通过历史帧信息自适应调整时间域窗口大小,在空间域利用颜色和LBP描述的纹理特征消除部分阴影问题。在复杂场景下的实验表明,该算法在实时性和检测准确率方面都有很大提高。2)在单视点移动摄像头场景下,针对背景差分法中所出现的行人静止检测失败、动态背景检测准确率低和高空视频存在的行人目标较小、行人姿态多变、背景复杂及干扰噪声较大等问题,提出了一种融合目标多特征的行人检测算法。该算法融合了行人目标的HOG、LBP及SIFT特征,并利用主成分分析降低特征空间维数,另外根据每种特征在检测过程中所占比重不同设置了不同的权值,有效解决了背景差分法行人检测的不足,同时对高空拍摄的视频也取得较好效果。3)针对由于高空视频细节模糊、背景杂乱等特点所导致行人分割与识别困难问题,提出了一种基于卡尔曼滤波和显著区域检测的行人识别算法。在分割行人时使用显著区域检测分割算法确定场景显著目标;在后期匹配过程中,先用卡尔曼滤波算法将候选区域标出再进行目标刷选,避免了在监督环境下选取固定数量候选人的问题。通过复杂场景下实验表明,该算法有效提高了自适应性、实时性和识别准确率。
其他文献
欠费现象已成为世界各国邮政业的一大顽疾,邮政企业在业务收入快速增长的同时,用户欠费也逐年增多。对欠费的有效控制和管理也就成了众多公共事业大型企业急需解决的重要课题。
异常检测技术是一种重要的数据挖掘手段,被广泛应用于信用卡诈骗检测、入侵检测、疾病检测等各个领域。目前国内外研究学者从距离、密度、聚类等角度出发,提出了各种异常检测
Spiking神经网络作为新一代人工神经网络,其时间编码的计算优势使其在研究领域的影响力与日俱增。在视觉神经系统的模拟层面,建立恰当的计算模型以模拟视网膜神经元的图像特征
变电站作为电网中电力中转的重要节点,担负着电压转换和电能分配的重要任务,变电站能否准确、安全、可靠地运行事关整个电网的安全和稳定。基于IEC61850标准的数字化变电站采用以太网进行架构,一般网络所面临的安全威胁,数字化变电站网络同样需要面对,特别是GOOSE报文对实时性和安全性都提出了极高的要求,因此如何在新形势下保障变电站报文传输安全就成为一项亟待解决的问题。针对以上问题,本文做了以下几个方面
为深入研究生物大脑处理信息以及学习的能力,研究者们提出了人工神经网络,用来模仿大脑信息表达以及处理的过程,而其中具有最高仿生性的是脉冲神经网络,它表达信息以及处理信
颜色是人们识别图像的主要感知特征,在模式识别与计算机视觉领域发挥了重要的作用。随着科学技术的发展以及计算机处理能力的提高,处理高维彩色图像数据成为了可能,因此彩色
众所周知,在计算机视觉和模式识别学科内,人脸识别是一个被研究很广泛的课题。如何找到一些行之有效的人脸特征来描述人脸是人脸识别技术的核心问题,现阶段成熟的人脸识别算
随着互联网的发展,传统关系型数据库在海量数据存储、高可扩展性、高可用性等新需求下显现出自身局限性。NoSQL数据库因其模式自由、支持分布式、支持最终一致性等特性可以很
随着万维网服务与应用的极速发展与壮大,万维网深入人心,越来越多的人使用万维网。然而,万维网的高速发展也带来了新的问题,IP地址有限、网络安全问题、网络流量和Web访问延迟等
内存数据库在实时应用领域扮演着重要角色,在电力调度、工业控制、数据通信、航空航天、证券交易等领域有着广泛的应用。由于实时应用领域通常需要维护海量的数据,并且要求在