复杂场景下的行人检测方法研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:javaauto
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人检测在车辆自动行驶、社区智能监控、人机交互、战争监控等领域有广泛的应用,是当前计算机视觉领域的研究热点之一。论文以单视点固定摄像头和移动摄像头行人检测为研究对象,着重研究具有复杂场景下的背景动态变化及行人姿态多变情况下行人检测和标记问题。其研究内容及创新点体现在:1)针对固定摄像头复杂动态场景下,经典Codebook方法存在计算量和内存需求大、构建的Codewords不准确等问题,提出了一种基于超像素分割的Codebook目标检测方法(CBSP-OD)。该方法在HSL颜色空间下进行超像素分割,用L分量作为亮度值判断,解决了经典方法中计算量和内存需求大问题,同时也增强了缓慢光照变化的鲁棒性;通过采用相似像素的超像素区域块代替单像素进行Codewords构建,考虑了背景目标的完整性,使得背景Codewords构建的更加准确,进一步避免了计算量和内存需求大的问题。在复杂户外场景下的实验表明,该算法平均处理速度达到65帧/秒,基本满足大多数实时系统,准确度也有着显著的提高。2)针对单摄像头移动场景下,基于特征分类行人检测无法适应行人目标尺寸缩放、行人姿态多变和干扰噪声较大问题,提出了一种级联LBP、SPHOG和SURF特征的自适应行人检测算法(CFA-PD)。该算法基于逐级精细提取行人区域的思想,首先采用基于LBP特征行人分类器去除大量非行人区域,在提取出的行人区域用基于SPHOG特征行人分类器再次缩小行人区域,用基于SURF特征行人分类器检测并标记出行人目标。实验结果表明,该算法有效解决了行人尺度缩放、行人姿态多变和背景区域干扰噪声大问题,算法的准确度和实时性有较大的提高。3)针对行人姿态多变、行人与摄像头距离变化导致行人尺寸存在不同程度的缩放和摄像头视角变化,造成行人标记窗口不准确问题,提出了一种行人检测窗口自适应标记算法(PM-OTSU)。该算法以行人检测算法标记的行人窗口作为初始简图,并依据初始简图中要素的数量变化判断尺寸变化并改变标记窗口。实验结果证明,该算法有效解决了行人检测窗口自适应调节问题,算法准确度取得较大的改进。
其他文献
近年来,知识库在信息检索、文本理解等方面显得越发至关重要,但是如何为任意领域构建一个大规模知识库仍是一件非常有挑战性的工作。幸运的是,已有大量的图书在数字图书馆中
图像在获取的过程中可能包含模糊区域,这些模糊对图像质量的影响很大,影响人们获取想要的信息,因此有效的检测出这些模糊区域就非常重要。本文的研究是图像局部模糊测量与分割,具
随着当前监控视频数据的爆炸式增长,如何高效分析视频中的数据内容,并使其为智慧城市服务成为近年来关注热点。其中,对监控视频数据的分析,主要涉及对视频中目标进行定位跟踪以及
互联网为人类的生产生活提供了极大的便捷,各种技术随之应运而生。多媒体极大地丰富了人们获取信息的方式,而其中数字图像则是最主要的呈现媒介。每时每刻互联网都在传输成千上
随着互联网的普及,网络舆情逐渐成为对社会舆论具有重要影响的力量并且在很大程度上引导着大众对某一些舆论事件的认识,因此舆情分析技术便应运而生,它可以使政府或者企业及时了
随着网格计算、普适计算以及计算机通讯技术的快速发展,人们越来越希望能把资源、软件及应用更好地整合在一起,并以服务的形式向外提供给用户,因此云计算应运而生。为了实现
随着多媒体时代的到来,图片作为传递信息的主要媒介,已经成为人们表达情感、进行社交活动的主要工具。然而图像数量的爆炸式增长,需要人们耗费越来越多的时间去检索出满足需求的
中国书法是中国传统文化的重要组成部分。随着数字化技术的不断发展,越来越多的书法作品被数字化并保存到了数字图书馆中。用户在浏览欣赏数字化的书法作品的过程中,往往希望
远程数据采集是设施农业、工厂设备监控、环境监测等领域的重要技术手段之一。它集微控制器技术、嵌入式软硬件设计技术、传感器技术、数据通信技术等于一体,是当前和今后一
网络是20世纪后半叶对人类社会贡献最大、影响最深远的发明之一。网络对社会的影响超越了过去任何时代的信息传递手段,是人类社会全球化的主要推手和平台。但事物都有两面性,在