智能车辆双目视觉系统的研究与设计

来源 :吉林大学 | 被引量 : 0次 | 上传用户:zhaodhsnd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文主要研究将计算机视觉应用于智能车辆的视觉导航系统的原理和关键算法以及实现过程。主要目的是为智能车辆提供横向控制和纵向控制所需的控制信息。在横向控制方面,主要包括道路标志线的检测与实时跟踪;在纵向控制方面,主要包括道路上的障碍物包括静态和动态障碍物,主要是行进中的车辆的检测和实时跟踪。随着城市化的发展和汽车的普及,交通运输问题日益严重。车辆的智能自动驾驶不仅可以大大减少交通事故,提高汽车的主动安全性,还可提高公路的运输效率,同时,也减轻了驾驶员的负担。智能车辆是一个集环境感知、规划决策、自动驾驶等多种功能于一体的综合系统。 作为外界环境信息获取的主要途径,驾驶员视觉系统对于建立完善的智能车辆控制系统有着极其重要的作用。本文通过对国内外智能车辆驾驶员视觉系统的研究分析,在分析人类视觉系统的基本结构和视觉形成过程的基础上,对智能车辆的视觉系统需要完成的功能作了研究和分析,然后根据功能分析对基于双目的计算机视觉系统作了整体的分析和设计,把智能车辆的双目视觉系统分解为几个功能模块,包括双目摄像机标定和摄像机模型的建立、图像获取和图像预处理、图像分割、障碍物检测与跟踪、车道线的检测与跟踪以及摄象机模型参数更新。之后又对每个功能模块的功能以及实现算法作了进一步的分析和设计。 摄像机标定先要确定一系列基准点,这些点在世界坐标系统中的坐标已知且其图像坐标已测出,然后根据这些基准点来计算摄像机的参数。需要标定的参数分为两类:外部参数和内部参数。外部参数对各幅图是不同的,而内部参数是不变的。参数的标定是从客观场景到数字图像的成像变换的过程中进行<WP=74>的。双目立体视觉的两个摄像机得标定,首先需要先对每个摄像机分别标定,以求出它们的投影矩阵,然后求解相对定位问题,相对定位问题是指用场景点在两个图像平面上的投影来确定两个摄像机坐标系之间的关系。根据投影矩阵就可以获得双目摄象机的模型之间的关系。之后在获得的一系列的参数以及给出的世界坐标系、摄像机坐标系和图像坐标系之间的相互转化关系的前提下,建立了双目摄像机模型。本文中设定的是平行双目摄像机模型即两个摄像机的光轴是平行的。考虑实际道路环境中摄到的图像会有噪声,为了能准确地实现横向控制和纵向控制,必须对图像进行预处理。本文中分析了各种图像处理算法,最后采用处理速度最快的高斯滤波对图像进行平滑去噪。对两幅图像分别使用Helmholtz shear算法进行变换,使得位于地平面上面的可能是障碍物的目标的视差不为零,而地平面上的如道路标志线的视差为零。然后对变换后得图像进行视差计算,获得视差图,视差图分为两个区域即视差为零和非零区域。根据视差图对图像区域进行分割,从而分割图像为两个区域。在图像的视差非零区域,也就是障碍物可能存在的区域,根据象素的4-连通性来检测障碍物并且确定障碍物在图像中的位置。在判断连通性的算法中假设障碍物的灰度值近似相同,根据这一特征确定一个阈值来判断目标的连通区域。使用Kalman滤波器来跟踪连通的目标,获得目标相对于智能车辆的位置和速度。在跟踪阶段,本文中只进行了理论性的研究,采用基于自适应背景模型和Kalman滤波器来进行障碍物的跟踪和定位。建立图像的背景模型以及从背景中提取前景的算法。以障碍物检测部分检测到得障碍物得连通区域的中心以及区域的高度和宽度作为障碍物得状态向量,建立状态方程、测量方程、增益方程、状态转移矩阵以及状态估计方程。 <WP=75>在零视差区域,如果此图像是第一帧图像的话,使用车道线模板在整个零视差区域对车道线进行检测,否则根据前几帧对车道线位置的估计结果,在估计位置使用车道线模板进行车道线的检测,获得一组候选标志线,在候选标志线中选取最优特征点,然后使用哈夫变换获得拟合道路标志线,根据拟合结果,从候选标志线中选择最接近的拟合结果的标志线。使用Kalman 滤波器来动态估计出下一帧中道路标志线的位置,使得道路标志线的检测进入循环状态。行进中由于车辆的震动会引起摄像机的震动,从而摄像机几何模型参数也就发生了变化,而在下一帧图像的计算中,仍然会使用初始化时校准得摄像机几何模型参数,这样就会产生很大的误差,有报告说明,摄像机模型参数中得高度和俯仰角的变化,对图像分割和障碍物以及车道标志线定位有很大的影响,所以为了能使智能车辆的导航准确实现,必须在一帧图像处理完毕之后根据处理结果来重新更新摄像机几何模型参数。本文中介绍了两种模型参数更新的方法,包括利用视差图更新和利用双目视觉中道路标志线的对应关系。利用视差图的计算量比较大而且比较复杂,所以本文中采用了利用双目视觉中道路标志线的对应关系来计算需要更新的摄像机模型参数的值。论文的创新之处在使用双目视觉为智能车辆提供横向控制和纵向控制信息。利用人眼的视觉特点,使用Helmholtz shear算法对图像进行变换,建立视差图。根据视差的特点,对图像区域进行分割。利用目标的连通性来确定障碍物的存在,深度和视差的关系来对障碍物进行定位。利用车道线模板来检测车道线
其他文献
测量控制成果是城市数字化建设的基础,也为国家的基本建设提供了有力的技术支持,随着数字城市建设的快速发展,测量控制成果的信息化管理越来越重要。GIS技术的发展和成熟,为计算
地籍管理是土地产权管理的核心环节,是国家依照法定的程序,将土地权利及其变更事项记载于专门的薄册,以加强政府对土地的有效管理。规范、科学的地籍管理,必须依靠科技手段来实现
本文在总结前人研究成果的基础上,建立了一个基于模糊理论和多分类器集成的自由手写体数字识别系统。 本文充分利用模糊理论的特点,将模糊描述、模糊决策和模糊识别有效
多播是当前计算机网络应用较广的一种连接方式。多播涉及到将同一信息从源节点传送到网络中的多个不同的目的节点。多播问题的关键在于确定信息到多个目的节点的传送路径。目
学位
由于手持、便捷、移动和可计算设备以及无线通信快速发展,无线多跳网络运应而生。无线多跳网络通过自组织方式动态地建立网络,允许节点在无需固定网络支撑的环境中无缝通信。由
我们在Linux操作系统上开发了数据库应用开发工具LAppBuilder,希望对Linux平台下用户和开发人员间的矛盾有所缓解。 LAppBuilder是Linux平台的Kylix应用软件的辅助开发工具
本文首先分析了松散耦合型分布式数据库的特点,详细阐述了一种基于对象描述模型,建立关系图,在全局视图模型上进行视图分割规范数据分布状况的流程方法。 本文提出了一个在整
本文在深入研究JDF标准和现有印刷工作流程的基础之上,结合框架软件设计思想,设计并实现了JDF流程开发框架,以方便JDF流程产品的开发。该框架包括JDF对象模型和JDFServer两大部
BACnet是楼宇自控领域中唯一的开放性国际标准,不同厂家生产的楼宇控制设备,只要符合BACnet协议,就可以相互通信、协调工作,从而实现互操作。然而时至今日,仍有一些楼宇自控
RSA密码系统是目前应用最为广泛的公开密钥密码系统。RSA密码系统中最核心的运算是模乘幂运算,即计算YEmodN。模乘幂运算由一系列模乘法运算实现,模乘法运算是模乘幂运算的基础