基于视觉感知的汽车智能驾驶关键技术研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:cwy198783
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
感知技术作为智能驾驶领域中的关键技术之一,决定了汽车自主驾驶的能力和智能化水平。而行人检测作为感知检测任务的重要一环,在摄像机较低的成本和不错的性能下,使得基于视觉图像的行人检测技术得到了广泛的研究。因此,本课题将基于视觉图像对行人检测难点展开研究。本课题的主要研究工作如下:对比分析了目标检测和行人检测模型的发展,研究了基于深度学习的目标检测基础理论,包括常见网络结构和训练策略,以及驾驶场景数据集。为了解决大图像中小目标易漏检的问题,提出了基于图像分区的道路行人小目标检测方法。首先结合City Persons数据集特性,设计了一种新的行人类别标签,并构造一种分区数据集;进一步,对比分析了YOLO v3和v4直接检测行人的结果;其次,基于YOLO v4完成了图像先分区检测再合并的策略;在图像分区检测下裁剪比例为0时,小目标行人SR_person的AP值从直接检测的35.29%提升到了61.15%;最后,为提升行人特征表征能力,模型采用了USC数据集预训练,使小目标行人SR_person的AP值从图像分区检测的61.15%提升到了63.61%。为了解决图像分区检测引起的模型处理速度慢和正常行人区域检测不全的问题,提出了基于聚类思想的道路行人小目标检测方法。首先结合行人类别分布特征,采用DBSCAN对行人类别标签聚类制作出一种新的行人聚类标签;进一步,基于YOLO v4训练一个聚类检测模型,并对聚类结果实施迭代合并和分区填充操作;然后将调整后的聚类区域送入检测模型;最终在聚类分区裁剪比例为0.2时,小目标行人SR_person的AP值从图像分区检测下裁剪比例为0.2时的64.06%提升到了69.51%。为了提升遮挡行人的检测效果,提出了基于渐进定位YOLO v4的道路遮挡行人检测方法。首先对比分析了一阶段和二阶段网络的优缺点;进一步,设计一种渐进定位网络结构,通过采用堆叠检测分支的方式,逐步提升检测置信度阈值,使anchor更精准的定位到目标区域;最终在图像分区检测下裁剪比例为0时,遮挡行人HO_person和SHO_person的AP分别从图像分区检测下的33.23%和17.45%提升到了37.70%和20.79%。开发了一种基于视觉图像的驾驶环境感知平台。将本课题不同算法进行移植使其满足低配置计算机的运行要求,并在不同处理器下进行了性能测试。
其他文献
全球家电企业市场竞争日益激烈,产品迭代更新快,在新产品的制造、设计过程中大量的工程技术图纸需要被设计、修改、参阅,形成了丰富的图纸资源库。顺德作为家电重镇,有许多小家电企业都面临着内部产品图纸管理与保密。各企业间的基本现状是大量产品、模具、专用设备、工装夹具的CAD图纸掌握在各个职能部门及少量人员手中,缺乏有组织、规范的集中管理。在行业中研发设计人员流动相对频繁,这就容易造成大量的图纸丢失、泄密,
双目立体匹配是模拟人类视觉获取深度的技术,广泛应用于路径规划、光学测量和即时定位与地图构建等领域。相比于传统方法,基于深度学习的双目立体匹配技术具有特征鲁棒性好、视差结果稠密等特点,但面临高反光物体引起的过曝现象时,仍存在误匹配问题。同时,相关数据集的缺乏限制了过曝场景下相关技术的研究。镜面反射引起的过曝现象会导致双目图像的匹配特征消失,引起误匹配导致视差估计精度降低。因此,本文从修复过曝区域丢失
目标检测是计算机视觉中的一个基本问题,它可以为实例分割和姿态估计等许多视觉任务提供支持,但因为仅有图像信息在某些情况下准确度还有待提升。通过无线信号来获得定位信息可以用来得到需要被检测对象的数量和位置。随着物联网的发展,能量可收集无线通信得到了越来越广泛地应用,它可以帮助无线传感器从自然界中获得能源来驱动通信。本文将目标检测框架、无线定位装置和能量采集无线通信相结合,设计了一个目标检测系统。整个系
常规数字化相机采用“红-绿-蓝”单传感色彩滤波阵列实现对真实场景色彩信息的获取,以达到节约存储空间的目的,所获取的每个像素位置只能表征红(R)、绿(G)、蓝(B)颜色中的一种颜色值,以这种方式获取的图像通常被称为马赛克图像。马赛克图像必须超分辨重建才能恢复成RGB彩色图像,这一过程叫做图像去马赛克。对图像去马赛克会带来数据量的增加,如果再进行图像压缩,则会影响数据压缩效率。为了节约存储空间和传输带
由于性价比高和对人体相对低的辐射剂量,全景X射线和锥束CT是目前牙科分析中有用的检查方式。牙齿分割是诊断牙齿疾病(如龋齿拔牙或牙髓疾病)前的关键步骤,但术前人工标记牙齿区域的过程既复杂又耗时。医学图像中牙齿分割的主要挑战在于三个方面。(1)外观变化大:对于有缺牙、修复体、矫治器的病例,主牙区的外观可能发生较大变化。(2)局部成像过于明亮:修复体和假体的牙科材料会产生明亮的金属伪影。(3)牙根周围边
视觉SLAM技术是机器人、无人驾驶、视觉惯导、虚拟现实以及增强现实等新兴邻域的核心技术。视觉SLAM技术的精度、鲁棒性和实时性是影响其在这些先进科技邻域中产业化应用的主要因素。传统的两类视觉SLAM方法,直接法和间接法,各自都存在一些优势与不足,且两者的特性非常互补。一类新的视觉SLAM方法通过将这两种传统视觉SLAM方法进行融合,结合两者的互补优势来提升性能,这类新方法被称为半直接法或混合方法。
静态随机存储器(Static Random Access Memory,SRAM)是片上系统(So C)的重要组成部分,被大量应用于手持电子设备、传感器和医疗器械等超低功耗应用中。由于动态功耗与电源电压呈平方倍的关系,降低系统电源电压可以极大地降低其功耗。但由于在超低压下SRAM单元难以稳定工作,单纯地降低电源电压已经不再能满足超低功耗的需求。从而在一些可以忍受低位错误的应用中,如视频图像处理、大
为了解决活门零件人工装配过程错装、漏装零件导致质量隐患的问题以及装配过后人工检错拉低活门产品生产效率的问题,本论文依托活门零件装配智能防错系统研究课题,对活门零件装配过程中的防错技术展开了研究。本课题依据防错理论,结合活门零件装配实际工况分析,设计了装配前可视化引导防错搭配装配后实时检测防错的“双保险”防错方案。其中,可视化引导防错采用参数化三维建模的方式对零件进行三维建模,依据工厂现有的二维书面
可见光和红外光电设备在军事和民用领域使用越来越广泛,将双波段集成的光电设备逐渐成为一种趋势。如何有效的测试多光路设备也逐渐成为光电设备发展的重要问题。本文主要研究内容是设计并搭建一套多光融合的光电测试系统,实现可同时对可见光和红外光电设备性能参数的测试。本文分析了光电设备测试系统中多光路融合的实现原理和二维成像器相关参数的测试理论基础。其中可见光相机关键参数包括调制传递函数(MTF)、分辨率、最小
科技资源检索是科技资源服务的重要手段,是决定科技资源是否能被切实、有效利用的关键环节。但科技资源在检索过程中往往存在检索精度低,人工投入大,结果不理想等问题。现有对科技资源的检索方式主要是通过用户输入查询关键词,得到一系列相关结果,再由人工筛选判断后找到合适的检索结果,使得检索结果冗余、不准确,且耗时耗力。现有方法的主要问题是缺乏对实际需求的匹配和对科技文本资源语义的理解。由于科技资源不同于日常普