道路场景下致密深度与语义的估计问题研究

来源 :浙江大学 | 被引量 : 1次 | 上传用户:XT327768823
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着人工智能研究的热潮,作为人工智能发展水平重要标志之一的自动驾驶车辆成为近年来的研究热点。在自动驾驶研究中,通常由感知、规划与控制共同构成了系统的核心组成部分。其中,感知中最重要的场景理解,指的就是通过计算机视觉等手段,实现对车辆周围外部环境的准确高效的解析。随着近年来深度学习相关技术的不断革新与发展,基于深度神经网络的场景理解方法逐渐展现出比传统方法更胜一筹的性能。但在面向场景理解任务的深度神经网络设计中,还存在着很多问题值得深入探索。比如:面向特定子任务,是否有更加有效的底层特征提取的卷积方式?如何有效结合车载激光雷达、彩色图像等异质传感器的数据源信息来设计更加有效的深度神经网络结构?如何合理利用场景理解的不同子任务之间内在的关联,构建联合、统一、性能更优的解决方案?
  通常,自动驾驶中的场景理解可以分为几何和语义两个方面。其中几何估计主要表现为场景的深度估计。为了适应当下自动驾驶的高精度和高分辨率的需要,几何和语义估计都必须达到致密的像素级。因此,本论文重点关注致密的深度估计与语义分割两个紧密相关的场景理解子任务。本论文以深度学习为基本方法,以神经网络中最基本的卷积方式为着力点和作为两个子任务的连接桥梁,对两者的关联进行了几个方面的有效尝试:在多源数据利用上,融合了激光雷达与彩色图像异质数据,构建了有效的网络结构;在底层卷积方式上,提出边界敏感的卷积方式,有效获取相似语义像素的特征;在多任务联合优化上,充分挖掘不同数据源之间、不同目标任务之间存在的关联性,有效提高方法的准确性。
  本论文的主要贡献如下:
  1.提出了一种基于语义先验信息的深度补全方法。面向道路环境下稀疏雷达数据的深度补全问题,该方法论文提出,通过观测深度信息在道路环境之中的分布规律,充分利用图像空间中存在的语义先验信息,分别针对于地面与障碍物体语义区域设计了不同的非对称多尺度卷积结构,以适用于不同语义区域在垂直、水平方向上的深度分布相似性。该方法提出了一种级联的网络结构,将基于图像-激光雷达联合输入的语义分割子网络与基于语义先验的深度补全子网络相结合,有效提升了致密深度估计任务精度。
  2.提出了一种基于图像轮廓信息指导的语义分割方法。面向道路环境下的语义分割问题,该方法提出,面向不同语义区域,设计特殊卷积方式。该方法提出了一种特殊的轮廓信息敏感的卷积结构,通过对于感受野内不同神经元赋予不同的贡献权重以用于有效融合特征信息。该方法提出的整体网络架构有效融合彩色与深度图像获得更好的轮廓检测结果,作为输入为语义分割网络提供清晰有效的轮廓先验信息。其后,整体全卷积神经网络有效融合了多尺度轮廓信息,结合提出的轮廓信息敏感的卷积结构构建了改进的语义分割网络模型。实验结果表明该方法有效提升了语义分割的精度。
  3.提出了一种基于轮廓信息敏感的语义分割与深度补全多任务神经网络。有别于前文提出的非对称多尺度卷积结构,该方法提出的联合多任务网络模型中,以轮廓信息衔接两个子任务,同时轮廓又作为深度补全与语义分割任务的弱监督信息融入卷积结构。该方法整体上提出了一种单编码器-多分支解码器的网络架构,同步为轮廓检测、语义分割与深度补全任务进行预测,同时提出并构建了多任务间的联合优化损失函数,同步优化网络整体性能。实验结果表明,相比单任务,本文的多任务设计框架有效提升了精度。
其他文献
目前,单频全球卫星导航系统(Global Navigation Satellite System,GNSS)接收机受限于自身软硬件性能,在高精度服务领域如形变监测等应用较少。鉴于其成本低、体积小等优点,但又受到其服务精度限制,本文对基于单频北斗卫星导航系统(BeiDou Navigation Satellite System,BDS)和全球定位系统(Global Positioning System,GPS)组合的实时动态载波相位差分定位技术(Real-time Kinematic,RTK)的质量控制进行
随着社会生活对高精度定位的需求不断提高,高精度定位技术及其产品的应用领域也日益广泛,尤其是在建筑物、边坡形变监测等领域。传统的形变监测方法主要依赖于精密的测量仪器,往往受到地理、人为和环境等因素的限制,难以满足如今大规模的形变监测要求。全球导航卫星系统(Global NavigationSatelliteSystem, GNSS)作为当下最先进的定位方式之一,其精密测量技术可以应用于形变监测领域。但是,在高楼鳞次栉比的城市或者在迂回盘曲的大峡谷等环境中,GNSS定位能力会随着卫星信号被遮挡而大幅度下降,而
摘 要:近年来,人们对于生活用电与生产用电提出了更高的需求,电力行业得到了进一步发展,这也使得各大变电站的运行压力有所提高。对于报等级而言,电力变压器是重要的运行设备,无论是中型电力变压器还是大型电力变压器,都对于电力输送环节起到关键性作用。在变电站主变压器中,变压器的风扇作为重要组成部分,对于系统设备是否能够正常运行起到关键性影响,从而也对变电站能否正常运行产生影响。因此必须要对变电站主变压器风
期刊
随着无线通信与物联网的蓬勃发展,未来通信系统将达到两个关键的要求。一方面,需要提供更高的系统容量,同时保证通信设备之间的资源管理。另一方面,需要支持大规模设备的连接服务。而最具代表性的两大应用技术车联网和窄带物联网(Narrowband Internet of Thing,NB-IoT)成为了万物互联的驱动力。车联网的出现提高了智能交通的管理效率,为人们出行提供了安全保障。而NB-IoT的广泛部署,为用户设备提供低功率、低成本、广覆盖、大规模连接的服务。同时,NB-IoT技术在车联网技术、智慧城市等场景下
多通道InSAR高程重建技术是一种很有价值的三维成像技术,通过多幅SAR图像之间的干涉信息获得地形高度,能够突破传统单通道InSAR技术中的相位连续性假设限制,在实际的数字高程模型生成中具有更高的精度。因此,多通道InSAR高程重建技术逐渐成为微波遥感领域的研究热点。本文主要针对多通道InSAR高程重建技术进行研究分析,主要研究内容如下:
  (1)对多种常见的多通道InSAR高程重建方法,包括基于聚类分析的多通道InSAR高程重建算法、改进的聚类分析算法、多通道最大似然高程重建算法、多通道最大后验
摘 要:喷油泵是柴油机的重要结构之一,在长期的运行过程中,由于运行磨损增加、保养不当、外部复杂因素影响等多种原因,会出现故障问题。喷油泵故障会影响柴油机的动力与运行性能,甚至会缩短柴油机的使用周期。因此,加强对柴油机喷油泵常见故障的维护与处理,及时解决故障问题,促使喷油泵运行状态稳定,是进一步保证柴油机运行稳定的主要方法。本文简要分析柴油机喷油泵的常见故障的产生原因,分别从检测技术与故障维修两个层
期刊
全景视频是近年来视频处理领域的一大热点。相比普通二维视频,全景视频描述了360°×180°的全方向场景内容,用户可以通过头戴显示设备自由选择视点朝向观看覆盖全视野的视窗内容。但高沉浸感的视觉体验也带来了巨大数据量的挑战。数据量剧增对全景视频在传输、存储环节造成很大的负担。为了沿用现有平面视频的高效编码技术,全景视频需要将球面内容映射表达为二维平面,而不同的表达格式会直接影响最终的压缩效率。此外,如何准确评价比较不同表达格式、不同编码技术的优劣是全景视频面临的新问题。因此,全景视频亟需制定合理的测试评价框架
摘 要:作为现代高层建筑中必备的机械设备之一,电梯为建筑中居住人群提供便捷的同时也提高了人们生活安全性与生活效率。但实际上,电梯设备本身是存在应用安全隐患问题的,所以在电梯使用过程中就需要对其相关设备技术应用规范进行检验,分析影响电梯安全使用的重要影响因素,结合实际情况分析强化电梯检验检测的有效方法,提出电梯安全性能的检验检测优化对策。  关键词:电梯安全性能;主要影响因素;检验检测方法  前言:
期刊
随着无线网络的发展,无线数据业务爆发性地增长,为了满足无线通信应用场景的需求,未来的通信网络需要提供更大的带宽和更高的频谱效率。然而随着无线电低频频段已趋于饱和,即便采用多址技术提高频率利用率,也无法满足未来通信发展的需求,因而势必要开发新的频谱资源。相较于低频段,毫米波频段有丰富的带宽资源。利用毫米波波长短的特性,通过布置大型天线阵列还可以提供显著的波束成形增益。毫米波的价值已在无线通信领域得到认可,受到工业界和学术界的普遍关注。
  鉴于毫米波的特点,传统低频通信中的系统优化与分析方法已不再适用
摘 要:随着我国经济发展和社会生活的进步,人们对建筑物的功能、结构和体型有了更高的要求,因此需要在建筑设计中运用更加先进的技术,使建筑设计效果能够得到有效提高。本文从在建筑设计中应用 BIM 技术的重要作用、BIM技术在建筑设计应用中存在的问题和BIM技术在建筑设计中应用措施等方面进行分析,希望对BIM 技术在建筑设计中的科学应用起到一定帮助。  关键词:BIM 技术;建筑设计;应用  BIM 技
期刊