【摘 要】
:
随着自动驾驶、机器人、虚拟现实等技术的不断发展,3D视觉技术在计算机视觉领域中得到了越来越多的关注。基于图像的3D视觉是计算机视觉中场景理解的一个重要研究方向,其主要目标是从RGB图像中推断真实世界对象和场景的3D结构及其内容。基于深度学习的语义分割技术具有较好的场景内容解释和理解能力,基于深度学习的双目立体匹配技术可以从一对双目图像中恢复场景的3D信息,较传统算法具有精度高、速度快等优势。随着智
论文部分内容阅读
随着自动驾驶、机器人、虚拟现实等技术的不断发展,3D视觉技术在计算机视觉领域中得到了越来越多的关注。基于图像的3D视觉是计算机视觉中场景理解的一个重要研究方向,其主要目标是从RGB图像中推断真实世界对象和场景的3D结构及其内容。基于深度学习的语义分割技术具有较好的场景内容解释和理解能力,基于深度学习的双目立体匹配技术可以从一对双目图像中恢复场景的3D信息,较传统算法具有精度高、速度快等优势。随着智能传感器、场景理解等技术需求的进一步发展,基于语义信息的双目立体匹配研究在场景理解中具有重要意义。本文研究并设计了一个基于语义信息的双目立体视觉算法,基于深度学习技术,主要针对利用分割语义信息指导视差优化、网络结构的模块化设计等方面进行了深入的研究与探讨。现将本文主要研究内容概括如下:(1)针对现有基于深度学习的双目立体匹配网络灵活性不足、无法很好地平衡速度和精度指标的问题,本文提出了一种网络结构模块化设计的思想。在一个轻量化特征提取模块基础上,设计了分割特征融合模块(Semantic Fusion Module)和视差特征融合模块(Disparity Fusion Module),分别用于语义分割图和视差估计图的估计。这种多视觉任务共用网络backbone的设计,可以提高模块利用效率同时降低网络参数量。实验结果表明,在轻量化网络结构的基础上,增加这两个模块,可以得到效果较好的语义分割和视差估计结果。(2)针对现有基于深度学习估计双目视差的方法中,没有较好使用语义信息优化视差的问题,本文提出了一种针对室外自动驾驶场景中基于语义信息的视差优化的方法,设计并实现了一个语义特征调整模块(Context Adjustment Module)。此模块选择左目视图的语义分割图指导优化立体匹配的视差图,对分割图和视差图进行有效的特征融合。实验结果表明,在原有网络结构的基础上,此模块可有效提高图像中部分区域的视差估计精度。(3)针对现有多任务网络结构中双目立体匹配网络灵活性不足的问题,本文借鉴软件系统中的模块化扩展思路,实现了双目立体匹配网络结构的模块化扩展和使用。针对不同的应用需求,本文设计了四种方案,在不同的精度和速度需求下,可以使用不同的方案,选择合适的网络模块进行训练并使用,以满足不同的应用场景,提高网络结构使用的灵活性。
其他文献
随着信息社会的高速发展,人们对无线通信的速率需求日益增长,5G通信技术推广以来,可重构天线研究引起了相关领域内学者们的广泛关注。本文基于极化转换超表面的相位突变以及极化转换特性,加载合适的可调谐器件构成透射型可重构极化转换超表面,同时结合灵活的相位编码算法,达到超表面功能可重构目的,这在通信及军事领域具备极大的应用前景。首先,完成了对透射型极化转换超表面工作机理和相位调控理论的研究。先从电磁波的极
超表面是超材料的二维版本,由于它们易于制造,并且在电磁波控制方面具有强大的能力,因此引起了人们广泛的关注。然而,到目前为止,这些被证明的超表面大都是基于非手性的元原子,并以同样的效率对左旋圆极化(LHCP)和右旋圆极化(RHCP)波的振幅和相位进行调制,对圆极化波展现出不同反射特征的自旋选择性超表面的讨论较少。针对这个问题,本文结合手性结构的特性与Pancharatnam-Berry(PB)相位理
目前,生活中的充电方式大多为有线充电。有线充电在广泛使用的同时也存在一些弊端,例如线路复杂,电线容易老化等。为了寻求一种更安全且便捷的充电方式,无线能量传输技术应运而生。无线能量传输摆脱了导线的控制,提高了充电的安全性,同时也使充电更加灵活,广泛应用于特种设备以及一些智能产品的供电上。最早提出无线充电的概念是特斯拉,自此以后,越来越多的研究人员投入到无线充电技术中,使其成为了目前世界上研究的热点领
对遥感卫星图像中道路的准确提取不仅可以为道路规划、区域建筑设计等城市建设规划提供切实的参考,也可以为军事测绘、灾害评估等提供支持。利用图像处理、机器学习和深度学习方法对遥感图像中的道路进行自动化提取是当前的热门研究领域。近期的研究成果表明,采用深度卷积神经网络对遥感卫星图像进行道路提取,效果明显优于经典方法。但同在道路识别中也存在道路中断、道路边缘粗糙等问题。这些问题导致道路提取结果不能直接用于空
随着我国社会经济的发展,在户外探险与体育竞技等领域有越来越多的人开始重视运动健康与运动安全。对运动状态以及人体健康数据进行监测,防止在运动过程中由于运动不当而导致运动损伤的出现显得尤为重要。现有的可穿戴智能设备可以实时监测并显示运动者的健康数据以及运动状态,在单人短时间运动的场景中可以很好地监测运动者的运动健康数据,然而由于可穿戴设备是单机环境,查看健康数据及运动状态只能由智能穿戴设备的佩戴者完成
近期,日本排放核污水的事件闹得沸沸扬扬,也让大家再次陷入遭受核污染的恐慌里。有人说面对灾难时,艺术是"无力"的。其实不然,多年来,不少艺术家都对核污染密切关注。他们有的以"浪漫"的形式把无色无味的核污染呈现出来;有的"玩命"般走进禁区进行创作;有的通过作品悼念核灾难……他们以切实行动,唤起人们对核污染的关注,并激发大家对和平、美好的希望。
进入新世纪之后,信息化战争的要求和民用通信技术的不断迭代使得军用及民用无线电系统得到了前所未有的发展,无线通信设备的种类和数量不断增加,由此带来的天线间的耦合和干扰问题却很难解决。可重构技术在天线小型化、增加信道容量、抗干扰等方面具有很大的优势,而多功能可重构天线将多种可重构模式结合到同一天线中,相比单一功能的可重构天线占用空间更少,适用场景更多,可以实现更加灵活的性能调节。本文重点围绕天线的复合
王维的山水田园诗十分有名,其山水田园诗之中蕴含着一幅幅美丽的静态画。笔者在此文中对王维山水田园诗中静态画面构成方法进行分析,以期对王维的山水田园诗作进行更深层次的解读。
随着目前移动互联网络的快速发展和智能设备的广泛普及,手机逐渐成为人们在互联网中对外交流的重要窗口,移动设备中就产生了大量的敏感数据信息安全问题。面对这些数据信息泄露和被窃取等潜在的风险,如何保障个人相关敏感数据的信息安全是当前迫切需要解决的问题。一般的应用中是直接基于密码技术直接加密的方式进行保密,但这种情况下依旧存在暴露的风险,因此不仅需要保护数据信息不泄露,同时需要保护保密这种行为不被识别。而
伴随着宽带阵列雷达应用的逐渐广泛,在进行宽带阵列信号处理时,必须考虑各个阵列通道间存在的幅频和相频特性的不一致,即通道失配。通道失配的存在会对阵列雷达后续的信号处理算法产生严重影响,降低阵列雷达的测角测距精度、分辨力以及抗干扰能力,进而使宽带阵列雷达的整体性能受到影响。因此,对宽带阵列雷达中的通道失配进行校正就显的格外重要。本文的研究内容如下:首先在分析阵列模型的基础上,探讨了几种通道失配模型的建