【摘 要】
:
立体视觉能够重建环境的三维信息,在获取深度信息方面具有灵活性高、成本低的特点,因而在自动驾驶、虚拟现实、机器人导航、非接触式测量等领域得到了广泛应用。其中,立体匹配是双目立体视觉中的核心关键技术,其目的是计算经过校正的左右图像中匹配像素的视差值。近年来,随着人工智能技术的发展,基于深度学习的立体匹配技术相比传统方法,在性能上取得了很大的进步,但是在复杂的实际场景下,仍然存在着较大的改善空间。本文主
论文部分内容阅读
立体视觉能够重建环境的三维信息,在获取深度信息方面具有灵活性高、成本低的特点,因而在自动驾驶、虚拟现实、机器人导航、非接触式测量等领域得到了广泛应用。其中,立体匹配是双目立体视觉中的核心关键技术,其目的是计算经过校正的左右图像中匹配像素的视差值。近年来,随着人工智能技术的发展,基于深度学习的立体匹配技术相比传统方法,在性能上取得了很大的进步,但是在复杂的实际场景下,仍然存在着较大的改善空间。本文主要针对立体匹配技术中存在的三个问题进行深入研究。首先,现有技术在遮挡、光照变化、弱纹理等不适定区域存在较大的匹配歧义,影响了整体视差精度的提升。第二,当前主流的基于3D成本体的立体匹配算法,假设视差概率分布为单峰分布,利用预测的概率对候选视差进行加权求和,获得最终的结果。而在实际场景中,获得的概率分布往往存在多峰现象,这会导致视差外点的生成。第三,在网络训练中,广泛采用的视差损失更加侧重近处的大视差区域,而忽略远处的视差估计性能,这对整体视差精度和后续目标检测等下游应用造成不利影响。本文的研究内容和贡献主要有以下三点:(1)针对不适定区域的匹配歧义问题,本文引入高层的全景语义信息指导视差的估计。我们在立体匹配分支中结合了语义分割和实例分割两个任务,并提出了置信度、视差残差和损失模块,分别从全景特征、类别和几何结构角度对视差进行优化。考虑到左右匹配像素在语义特征和实例特征上的一致性,置信度模块通过计算不同候选视差下语义和实例特征的相关性来调整成本体中的概率分布。视差残差模块将视差图按照语义和实例类别区分为多个通道,采用深度可分离卷积获得语义和实例相关的视差残差。损失模块进一步利用全景图和视差图的几何相似性,生成全景指导的边缘和平滑损失对立体匹配进行监督。整个模型在多个公开数据集上进行实验和分析,证明了引入全景信息的有效性。(2)针对预测阶段视差概率分布的多模态问题,本文提出了基于无偏移单峰分布成本体的立体匹配算法。我们首先分析了视差概率分布的不同类型,其中多峰分布以及偏移的单峰分布都会造成预测误差。为了解决该问题,我们从三个角度出发来设计网络结构。充足的特征能够帮助网络更好地学习到单峰分布,我们在一般的3D卷积基础之上,引入了沿视差维度的2D卷积来获得全局的视差特征。然后,我们提出了自监督单峰损失,促使多峰分布能够趋近于单峰。最后,利用逐步优化结构迭代预测视差概率与视差偏移量,以此来微调偏移的单峰分布。整个网络能够在有监督和无监督两种模式下进行端到端训练,实验表明我们的方法能够有效提升视差估计的性能。(3)针对传统视差损失对于远近像素的侧重不平衡问题,本文提出了归一化视差损失,它能够嵌入到绝大多数的立体匹配网络中提升中远距离处视差的估计精度以及整体的匹配性能。我们观察到,传统视差损失随着视差值的增加而变大,这会导致远处的损失过小,无法得到有效训练。我们引入了一个代价函数来模拟这一趋势。通过将视差损失与该代价函数进行相除实现归一化,能够使得网络更加均衡地训练不同大小的视差。除此之外,由于获取代价函数时存在统计误差,我们限制了其最小和最大值,以此来避免潜在的异常情况。我们在多个公开的立体匹配数据集和不同的基线模型上进行了充分的实验,验证了归一化视差损失的通用性和有效性。同时,将该方法获得的3D点云输入到3D目标检测网络中,能够提升中远距离处的检测精度,说明该方法对于立体匹配的下游任务具有很好的应用价值。
其他文献
以济南市L中学“校园墙”新媒体平台的调查为基础,运用虚拟民族志的参与观察法和访谈法的质性研究方法,考察中学生在QQ空间“校园墙”上表露出的心理危机,并分析其行为的共鸣心理。研究发现,中学生在互联网的心理危机表露有人际交往、家庭生活和学业压力三个层面,每个层面下又呈现出为多个具体表现,在面对这些心理危机表露时具有独特的共鸣体验。
随着我国城镇化发展进程不断加快,人民群众的收入水平获得了大幅增长,这为食品行业的发展提供了更多的机会。而休闲食品作为主食的补充,同样也在这广阔的增长空间中赢得了一席之地。M公司创始于1995年,是云南省发展较早的休闲食品企业。M公司的主打产品也具有较强的云南特色,作为云南省知名品牌,同时也是一张宣传旅游形象的名片。但是随着市场竞争的越演越烈,越来越多的中小企业快速成长起来的同时,很多跨国企业也加入
为了解决玩教具在创新设计过程中遇到的问题,获得更加适合幼儿园玩教具创新设计与制作的流程。文章基于事理学方法论探讨幼儿园自制玩教具产品的创新设计要素和设计流程,并以此来指导设计实践,以期为幼儿园自制玩教具产品创新提供新的思路与方向。
<正>“静观为画,动则成戏”是对皮影戏很好的概括,本文通过了解皮影戏的含义,追溯皮影的历史起源,研究皮影艺术的制作工艺,分析皮影艺术的特点,探究如何在新时代下保护、传承并创新我国的传统艺术。一、皮影戏的含义皮影戏是一种光影的艺术,被称为“灯影戏”或“影子戏”。它是用兽皮或纸板刻出人物的剪影,使剪影在灯光的照射下投射在白色的幕布上进行表演,生动地还原一个个民间故事,所以自古有“一口道尽千古事,双手舞
种植课程是与自然有关的课程,也是幼儿获得自然经验的主要途径。幼儿园种植活动实践中,应注意从源起、过程、成果都关注童心关注自然,“守护童心,师法自然”是种植活动实践的重要原则,应注意聆听幼儿、放手幼儿、接纳幼儿。
本文主要从江苏省农产品冷链物流的现状入手,从现在存在的优势、劣势、机会、威胁对江苏省农产品冷链物流进行了剖析,提出了相应的对策和建议。对于促进江苏省生鲜农产品冷链物流的快速发展有着借鉴作用。
在我国社会经济快速发展的推动下,当前的建筑工程行业正处在竞争压力不断增大的时期。尤其是近几年来,我国房建工程的建设规模以及建设数量不断扩大和增加,这也让工程项目施工管理工作的难度进一步提高,但我国的施工现场管理工作当中仍旧存在诸多的问题和缺陷。事实上,建筑工程施工工作的现场管理极为重要,他直接决定了现场施工工作的条理性,施工进度以及整体施工质量水平,只有不断对现场施工管理进行优化和升级,才能让实际
文章以老年助行器的外观为研究对象,采用感性工学的测量和分析方法,对老年助行器的造型和CMF进行研究,以满足老年人的感性需求。首先建立感性样本库和感性词汇库,通过语义差分问卷、因子分析得出最具代表性的感性意象词。再制作老年助行器的造型样本和CMF样本,采用眼动追踪和多元线性回归的方法进行分析,获得优选的造型方案和CMF方案。给老年助行器的外观设计提供可供参考的方法,并设计出满足用户感性需求的老年助行
<正>现代都市生活节奏快,工作压力大,不少人会选择饲养一只宠物犬来陪伴自己,通过与其互动来增加生活乐趣,提升幸福感。因此,挑选一款合适的狗粮对于宠物犬的健康来说尤为重要,面对市场上各式各样的狗粮产品,消费者在购买时应该考虑以下三点:第一点,根据年龄选择宠物犬和我们人类一样,在不同的年龄段有不同的营养需求。