面向汽车辅助驾驶的远红外行人检测关键技术研究

被引量 : 0次 | 上传用户:johnwangjohn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于远红外成像的行人检测已成为计算机视觉与模式识别领域的研究热点之一,远红外图像不依赖于场景的光照条件,反映的是具有不同热辐射率的场景目标的表面温度分布,能够捕捉黑暗和烟雾等环境中的行人目标,故基于远红外成像的夜间行人检测在汽车辅助驾驶系统和智能监控系统中具有重要的应用前景。由于行人目标的非刚体性质和较强的运动随意性,其外观模式通常呈现出复杂多变和尺度不一等特点,导致其具有较高的类内多样性;与可见光图像相比,远红外图像中的行人目标还具有纹理信息较少、分辨率较低的特点,因此,基于远红外成像的行人检测是一个极具挑战性的研究课题。本文围绕面向汽车辅助驾驶的夜间行人检测问题展开研究,基于配备单目摄像头的车载平台,研究解决保障检测系统实时性、准确性、适合于变化场景的行人检测问题,涉及候选区域(Regions of Interest, ROIs)提取方法、远红外行人描述特征的提取方法、行人识别方法等方面关键技术的研究。论文的主要贡献如下:1)提出一种基于概率模板匹配的远红外行人检测方法。根据行人的运动朝向建立多尺度概率模板,缓解因外观模式引起的行人类内方差较大的问题;进一步将目标跟踪/多帧校验方法融入概率模板匹配的过程,综合利用行人在多帧图像之间出现的连续性和检测结果的一致性滤除不稳定的误检模式,并填补部分由于ROIs提取精度不高所造成的漏检行人。实验表明该方法能够较好地保障检测系统的实时性,与基于行人步态模式的概率模板构建方法相比,文中方法归纳行人外观模式的能力更强。2)基于统计学习的识别框架,提出熵加权方向梯度直方图特征(Entropy WeightedHistograms of Oriented Gradients, EWHOG)描述远红外行人,综合了所描述目标的局部形状信息和局部梯度分布的随机信息,确保其局部形状能够更好地被局部密集像素梯度或边缘方向表示;为了解决因成像尺度不一等因素引起的目标类内方差较大的问题,提出基于EWHOG特征的三分支结构支持向量机(Support Vector Machine, SVM)行人识别方法,并利用快速分类支持向量机(Fast Classification Support Vector Machine,FCSVM)对获得的支持向量进行优化,从而约简识别环节所需要的计算和存储开销;根据远红外行人头部及其与周围背景之间灰度分布的差异性,提出进一步抑制误检目标的行人头部校验方法。实验表明:EWHOG特征能有效区分远红外行人;快速分类方案以轻微降低行人识别准确率为代价,保证检测系统运行的实时性,在市区和郊区场景中均获取了较好的检测性能。3)针对行人检测本质上属于“稀有事件检测”问题的特点,从ROIs提取的角度出发,提出一种基于像素梯度的垂直投影方法,根据远红外图像中天空与路面等背景区域通常具有大范围高灰度同质性的特点,利用图像梯度信息对可能包含行人的竖直带状图像区域进行初定位,避免对整幅输入图像进行搜索;实验表明该方法能够提高ROIs提取阶段的搜索效率,并能够抑制部分仅包含背景目标的候选区域。在行人识别阶段,将图像空间金字塔表示方法融入EWHOG特征的提取过程,在多层图像片(cell)划分方式下,利用局部方向梯度直方图的熵加权分布特性及其全局结构信息表征远红外行人,提出了金字塔熵加权方向梯度直方图(Pyramid Entropy Weighted Histograms of OrientedGradients, PEWHOG)特征;鉴于PEWHOG特征属于直方图统计特征,利用基于直方图交叉核(Histogram Intersection Kernel, HIK)的SVM分类器实现行人识别;针对收集具有代表性的训练数据较为困难、行人分类器的预测性能依赖于初始训练数据的问题,提出基于bootstrapping和提前终止策略的离线训练机制。4)训练数据与测试数据之间通常存在不可避免的数据分布差异性,这可能导致多数基于传统统计学习的行人检测方法在场景因素变化较大时表现得不够理想。针对这个问题,提出一种Boosting-style的归纳迁移学习算法DTLBoost,用于高效且有效地处理变化场景中的远红外行人检测问题。显式地定义成员分类器对训练数据的预测不一致性程度,将其融入DTLBoost算法的样本权重更新规则,从辅助训练数据中选择具有正迁移能力的数据,并鼓励不同成员分类器学习目标训练数据的不同部分或方面。最后在本文收集的数据集和OSU远红外行人数据集上,通过面向行人识别和行人检测问题的扩展实验评估了该方法的性能,实验结果表明该方法在新场景和变化视角场景中均具有较好的行人检测性能。
其他文献
近年来,随着工业的发展,石油的需求量增大,导致石油开采过度,石油产量急速下降,针对这一问题油田采用了注水的增产方式,但在注水增产中导致污水含量越来越大,对环境造成严重
作者依据有关资料分析认为 ,当前假冒伪劣产品遍及全球 ,愈演愈列 ,呈逐步升级的趋势 ;文章从利润冲动、打假法制不健全 ,防伪技术难以到位和国际贸易自由化等因素着眼 ,对滋
超薄型钢结构防火涂料的耐候性是影响其防火性能的主要因素之一。研究结果表明,只有对防火涂料再进行保护才能延长防火时间。为此研制了超薄型钢结构防火涂料专用保护面漆,可
瑞吉酒店及度假村在中国的首家度假酒店,也是西藏第一家奢华酒店——拉萨瑞吉度假酒店于2010年11月15日隆重开业,酒店的建成使用,为西藏填补了没有高档次酒店的空白.在海拔高
茶多酚是茶树[Camellia sinensis(L.)O. Kuntze]中主要的次生代谢产物,其含量可达鲜叶和嫩茎干重的18%~36%,包括酚酸、黄酮醇、黄烷-3-醇(儿茶素)、黄酮、花青素和原花青素等。不同
与纯铝导体相比,铝合金导体具有更高强度,可通过成分、加工方式及热处理来调节导体的综合性能的特点。本文以6101铝合金为基础,在优化铸锭均匀化热处理制度和固溶制度的前提
采煤技术在煤矿中的应用十分重要,这关系到煤矿的开采效率能否满足煤矿的要求,使煤矿开采数量获得更多的经济效益。然而,在许多煤矿企业中,由于自身的管理和洞察问题能力不足
随着社会经济的发展、经济结构转型及新型城镇化的推进,土地需求量日益增多,而我国土地资源十分稀缺。我国土地所有权包括国家所有和集体所有两种形式。集体所有的土地必须经
当今社会,数据无处不在,从海量的数据中找出有潜在应用价值的数据规律或数据模型,用人工的方式难以实现这个目标。随着技术的不断发展,越来越多的人选择使用机器学习从海量数据中
云渲染是新一代三维动画制作的关键技术。在电影制作领域,三维动画或者特效场景会通过云渲染产生大规模的图像数据,这些数据在系统内部的传输过程中会占用大量的带宽资源导致