基于单目视觉的场景理解算法研究

来源 :东北大学 | 被引量 : 1次 | 上传用户:luoch668
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着都市生活节奏的加快,汽车已成为人们生活的一部分,与此同时,交通事故发生的频率也随之上升,成为全球范围内普遍担心的问题.安全辅助驾驶系统可以解决交通安全问题,道路场景理解是安全辅助驾驶重要组成部分,成为各国研究的重点.在分析总结国内外各种场景理解检测方法的基础上,本文提出新的场景理解检测算法.本文研究道路场景算法.对道路场景图像进行语义分割,将道路场景分为三类:天空、道路和障碍物.为了更准确、快速标注出场景图像的类别,利用极限学习机分类器(Extreme Learning Machine, ELM)对场景区域进行识别标注.首先,对场景区域提取HOG (Histogram of Oriented Gradient, HOG)特征,利用BW方法降维,再用ELM分类器进行分类识别,离线训练三个ELM分类器(天空、路地、障碍物);然后,识别出对应场景的类别.虽然利用该方法对场景进行了语义标注分割,但是检测结果并不是令人满意,为此本文将图像中其他信息考虑到新的模型中,并将分类器训练的结果作为初始类别标记结果,应用条件随机场(Conditional Random Fields, CRFs)模型进行图像分割标注.基于条件随机场的图像分割技术是近年来计算机视觉领域的研究热点.该方法的核心思想在于构造一个具有观察数据的概率图模型(Probabilistic Graphical Model, PGM),给出一个对应该图结构的势函数,根据条件随机场的学习与推断方法,来得到使得概率最大的语义标签,作为最终的标记结果.该模型的新颖之处在于它将像素点的梯度特征、位置特征、对于车载视频的前帧后帧关系以及边缘信息考虑在模型中.并且将其作为最大团(clique)上的势函数(Potential function)进行模型的建立.采用拟牛顿迭代法(Broyden Fletcher Goldfarb Shanno, BFGS)和环状置信传播(Loopy Belief Propagation. LBP)对模型分别进行训练和推断.本文算法在公开数据集MSRC (Microsoft Research Cambridge)、ICCV09DATA和真实场景视频中都进行了测试,识别率是84.29%.本文的工作是找出关联区域与区域,以及上下文之间信息的场景图像语义分割.
其他文献
学位
本文主要目的在于研究相对论欧拉方程组在一类大初值下整体熵解的存在性。目前一维拟线性双曲型方程组间断解的研究已经比较完善,特别是对经典的非相对论欧拉方程组。对相对论
本文应用文献资料法,专家访谈法和逻辑归纳法等研究方法,从用人编制、人才结构、战略目标等方面对吉林省竞走运动现状进行调查分析,从中发现存在问题并提出解决办法从而为吉
本文首先对有限维空间中多目标规划问题的Kuhn-Tucker真有效解展开了进一步的讨论。随后,在Banach空间中,引入了广义Kuhn-Tucker真有效解、广义Kuhn-Tucker真弱有效解等概念,
一、北京航空航天大学信息化历程北航的信息化建设经历了三个阶段:(1)基础设施建设阶段(7年):1994年12月开始网络1期建设;1997年9月进行网络2期建设;2001年12月进行网络3期建
彭明友是北京怀柔区普教系统唯一一名在职的全国劳动模范,在山区执教31年。他始终以无私奉献、忘我拼搏的精神奋战在山区小学教育的第一线,为改变山区教育的落后面貌,艰苦奋
如何实施软件质量保障,成为软件工程研究的一个领域。经过几十年的研究,人们达到一个共识,就是软件企业要想生产出质量符合标准的软件产品,必须有一套成熟的软件过程。 软件能
近年来,人类社会已经进入了大数据时代。信息科学和技术的快速发展,生产技术、生产设置和产业过程也变得越来越复杂。因此,利用基于物理和化学理论建立的传统数学模型方法,分
湖南省望城县莲花镇华林村党员李宇仁1999年被村党支部除名以来,为恢复党籍上访至今,引发了当地干部群众对农村党员标准问题的相关争议。华林村党支部和莲花镇党委认定李宇仁
本文研究巨型稀疏系统的行作用法。利用行作用法的观点重新分析了求解线性方程组的传统Jacobi迭代法,Gauss-Seidel迭代法和SOR迭代法。引出一个用于求解系数矩阵半正定(不必