基于深度学习的道路场景语义分割算法研究

来源 :贵州大学 | 被引量 : 0次 | 上传用户:kongjiahao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机视觉等相关技术的快速发展,自动驾驶汽车得以面世并快速迭代更新。对周围环境的准确感知是自动驾驶技术中极为基础和重要的一环,而图像语义分割技术可将汽车获取到的道路场景图像分割成表示不同类别的区域,可为自动驾驶汽车感知周围环境和做出决策提供重要的依据,已成为自动驾驶任务中不可或缺的技术。由于道路场景图像存在目标种类繁多、尺度变化较大等特点,道路场景语义分割成为一个具有挑战性的问题。传统的图像分割方法极度依赖于人工的特征分析和特征提取工作,不仅工作繁重,而且很难找到较为全面的特征,从而难以对复杂场景的图像做出有效的分割。近年来,深度学习得到了快速的发展,它可以从图像数据中自动学习到丰富的深层次特征,并依据提取到的特征获得高精度的语义分割结果。基于深度学习的道路场景语义分割方法克服了传统方法的局限性,具有很高的研究价值。目前,应用于道路场景语义分割的深度学习方法虽然取得了一定的成果,但还存在分割精度不高、分割速度不够快等问题。基于以上问题,本文深入研究了基于深度学习的道路场景语义分割算法,具体研究内容如下:1.提出了一个模拟大脑视觉机制的道路场景语义分割算法。(1)设计了两条支路以分别模拟大脑视觉皮层的腹侧通路和背侧通路。其中腹侧通路网络着重于提取图像的语义信息,背侧通路网络着重于提取图像的空间信息,并结合U型结构以获取更为丰富的空间信息,最后将两路的信息进行充分融合,得到高精度的分割结果。(2)提出了语义增强模块和空间注意力模块,分别用于强化腹侧通路网络对语义信息的提取和背侧通路网络对空间信息的提取。其中语义增强模块为在空洞空间金字塔池化模块中融入通道注意力机制改进而来,可有重点地融合不同尺度的语义信息;空间注意力模块可使网络在空间维度上更加关注于目标边缘等更重要的信息。(3)通过微调此算法模型的结构将其轻量化,使其满足实时性的要求,同时保持较高的分割精度。(4)经实验验证,该算法达到了82.1%的分割精度;轻量化后的模型达到了75.9%的分割精度和106.9FPS的推理速度,实现了精度和速度之间的平衡。2.从特征融合的角度出发,提出了一个基于双输入特征金字塔网络的高效道路场景语义分割算法。(1)将上一算法中提出的腹背侧通路结构加以改造,以两条路径接收和处理输入数据,分别着重于提取语义信息和空间信息,从而保证模型既能提取到丰富的信息,又能以较少的参数量运行。(2)设计了一个新颖的双输入特征金字塔结构,接收来自上述两条路径的带有不同信息的特征,在经过多重有效的特征融合之后,输出最终的分割结果,同时还重复利用了中间特征图,从而减少了计算量。(3)经实验验证,该算法达到了76.9%的分割精度和107.0FPS的推理速度,实现了在较高精度下的实时语义分割,可以应用于真实环境下的道路场景图像解析任务。
其他文献
绝缘栅双极型晶体管(Insulated Gate Bipolar Transistor,IGBT)是性价比高于功率MOS和BJT的高压大功率半导体器件,目前在中、大功率应用场合被广泛使用。由于其在开态时对漂移区具有电导调制效应,这类器件能够同时实现高耐压和低导通损耗。但是,IGBT器件在关断时漂移区中存在少数载流子的反抽和复合过程,会导致关断能量损耗较高。所以,改善正向导通电压和关断能量损耗之间的
光纤激光器由于其本身具有的多种优势,被广泛运用于切割,焊接,熔覆等加工制造领域,同时,各领域需求的增加也促使其输出功率被不断提高。然而,这也随之引发了一系列的问题,一方面,光纤包层中将产生过多的残余光,影响了输出光束质量,甚至损害激光器,另一方面,输出光纤端面的功率密度过高,造成输出端面的烧毁。为了解决上述问题,常在激光器输出端加装传能光缆组件,用来滤除包层中的残余光,同时降低输出端的光功率密度。
数控机床加工过程的智能监控是高端装备智能化的关键技术之一。它不仅能减少因加工异常而造成的零件、刀具和机床的损坏,而且可以通过自动调节加工参数、对机床进行远程集中监控管理以提高生产和管理效率。随着制造企业向智能制造不断转型升级,其对数控机床加工过程监控系统功能的丰富性、性能的实时性和可靠性提出了更高的要求。基于此,本文开发了一套基于边缘计算的可用于多场景、开放式、实时性和可靠性较强的数控机床加工过程
随着实时ETL、复杂实时事件处理(CEP)以及实时统计分析等实时场景不断增多,为流计算的发展奠定了基础。上一代Hadoop生态的数据处理系统大多是针对离线计算场景,其系统设计已经无法应付实时计算的业务。所以论文提供了专门针对实时场景的基于Spark的流计算系统,该系统能满足大多数的实时场景,已经在多个生产环境得到应用。论文实现了基于Spark的分布式流计算系统,该系统以Spark任务调度引擎、执行
公民参与权是宪法规定的基本权利之一。城市更新公民参与权是宪法权利在城市更新领域的衍生权利,是城市更新过程中公民合理维护自身权利的保障,可以具化为知情权、参与权、监督权、获得救济权等。可通过赋予公民城市更新参与权、加强公民参与城市更新意识、提升公民参与城市更新能力、保障公民城市更新参与权效力、拓宽公民城市更新参与权救济途径等方式,维护公民的合法权益,实现城市更高质量发展。
MEMS加速度计因其体积小、功耗低及灵敏度高等优点被应用在医疗、电子消费、汽车自动驾驶及航天航空领域。加速度计是由传感器及其接口读出电路组成,那么研究传感器结构及接口读出电路的设计对系统的性能至关重要。本文提出了一种电容式传感器及其闭环反馈接口读出电路,对此加速度计进行了结构设计、工艺设计及电路设计,并对此加速度计做了建模仿真分析以及版图验证测试等研究工作。通过对多种弹性梁结构的分析及本课题的需求
表面等离子体激元(Surface Plasmon Polaritons,SPPs)作为一种在金属与介质交界面传播的表面波,有着良好的局域限制能力,但只能在光以及更高频段才能被有效激发。人工表面等离子体激元(Spoof Surface Plasmon Polaritons,SSPPs)的提出将SPPs延伸到太赫兹以及微波等低频段,这可以通过设计金属表面几何形状来控制SSPP传播的截止频率来实现。基于
随着复杂网络的发展,网络病毒已经成为影响网络空间安全的关键因素。网络系统的安全态势感知、病毒传染的动力学模型及其控制问题作为当前研究的热点,关系着系统的安全与发展,有着重要的研究价值与意义。本文针对安全熵对网络安全态势的评估问题、病毒传播模型的安全稳定性问题和控制问题进行了研究,主要内容涉及基于不安全熵的网络安全态势感知模型、基于安全熵的SLBRS网络病毒传播模型和复杂网络病毒的反馈控制模型三个方
关系抽取旨在从文本中抽取已知实体之间的语义关系,并形成如{实体1-关系-实体2}形式的结构化三元组。句子级关系抽取中通常文本较短,其语法结构和语义信息完整性较低,存在严重的特征稀疏问题,很难从原始文本中获取足够的分类特征对实体关系进行良好建模。此外,由于关系实例文本通常包含多个实体对,目标实体对的位置、语义、结构等信息的缺失使得神经网络学习关系表示时受到“干扰实体对”的影响,难以对目标实体对精准定
初中生正处于培养和形成良好思维能力的关键时期,而对于初中英语教学来说,通过阅读教学帮助初中生培养和形成良好的思维能力就成为十分有效的手段。英语阅读教学与学生思维能力的培养是相互促进的,初中英语教师通过阅读教学既可以培养学生的思维能力和英语思维,又可以促使学生在英语学习中灵活运用思维模式和方法,提高初中生的英语综合素养与考试成绩,这就需要初中英语教师探究英语阅读教学手段与方法,以促进学生思维能力的培