基于视觉的室内场景布局估计研究

来源 :山东大学 | 被引量 : 1次 | 上传用户：fencer_2

【摘要】

：

室内场景布局估计问题是指根据室内图像估计其场景的整体空间结构,该问题在诸如室内三维重建、室内导航和增强现实等任务中有很大价值,具有重要的研究意义。近年来,室内场景

【作者】

：

张伟东

【出处】

：

山东大学

【发表日期】

：

2019年01期

【关键词】

：

室内场景布局估计场景理解编码-解码网络生成对抗网络深度估计

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

室内场景布局估计问题是指根据室内图像估计其场景的整体空间结构,该问题在诸如室内三维重建、室内导航和增强现实等任务中有很大价值,具有重要的研究意义。近年来,室内场景布局估计问题吸引了大量学者进行相关研究,在算法和准确性上均取得了长足的进步,但在实际应用中依然存在诸多未解决的问题:现有的工作对于布局特征图的预测结果普遍不够准确,且对边缘信息和语义信息的利用较为单一;现有布局估计方法的速度普遍较慢,难以转化为实际应用;现有工作只能得到布局的二维表示,其提供的空间结构信息有限。以上问题对于布局估计任务的准确性、运行速度以及实用价值均产生不利影响。本文分别针对这些问题进行了研究,并提出了解决方案,主要内容和创新点归纳如下:1.针对布局特征图预测结果不准确,且边缘信息和语义信息未被充分利用的问题,本文提出了联合学习边缘信息和语义信息的策略,并有针对性地设计了一种编码-解码结构的深度网络以生成准确且清晰的特征图预测。创新点和贡献可归纳为:(1)设计了一种编码-解码结构的深度网络,其中的编码器具有汇总全局信息的能力,解码器则可以由粗到精地生成准确且清晰的特征图,实现了高质量特征图的生成。(2)提出了边缘信息和语义信息的联合学习方法,网络采用两个独立的解码器分别预测边缘图和语义标签图,使两者互相受益,并可提供互补信息,生成准确且相对独立的边缘和语义预测结果,显著提高了算法的容错率。(3)基于边缘图预测结果和几何约束,提出了改进的自适应采样法用于布局的生成。此外,利用布局内在的结构相似性,提出了在预定义的布局池中直接搜索候选布局的方法。以上两种方法实现了高效而准确的布局生成。(4)为了进一步降低布局估计的错误率,提出了像素级的精细化算法,通过迭代不断在各个关键点的邻近像素中搜索更优的关键点替代当前关键点,得到优化后的布局。该精细化算法显著提升了布局估计结果的准确性。2.针对布局估计速度慢,难以实时应用的问题,提出了一种端对端的学习框架,可直接预测出输入图像对应的布局类型和各个关键点的坐标。创新点和贡献可归纳为:(1)提出了快速有效的端对端学习框架,采用边缘图作为桥梁连接了两个子任务,将问题转化为由图像预测边缘图以及由边缘图生成布局的分类和关键点坐标预测两个部分,将复杂问题进行了分解。(2)首先通过随机采样人为生成充足且类型均衡的布局样本,随后采用生成对抗网络将人为生成的布局样本进行风格转换,生成与边缘预测网络的输出有相似风格的边缘图,最后利用转化后的充足样本训练布局类型和关键点坐标预测网络,解决了端对端学习任务中训练数据不足和样本布局类型不均衡两大问题。实现了对布局估计结果的直接输出,显著提升了布局估计的速度。3.针对当前二维表示的布局估计任务中存在的诸多限制,提出了室内场景三维布局估计任务,标注产生了首个三维布局估计数据集,并提出了有针对性的算法。创新点和贡献可归纳为:(1)首次提出了三维布局估计任务,用地面、墙面等室内平面的深度来表示布局,通过相机参数可进一步将其转化为三维点云,生成布局的三维结构,反映了布局的三维信息。(2)基于相机投影原理,推导出了现实中的平面在深度图中的一般方程,即每个像素深度值的倒数与其坐标为线性关系,为后续算法提供了理论基础。(3)利用该方程,本文基于已有的室内环境下的RGB-D数据集进行标注,生成了首个三维布局估计数据集。(4)提出了三维布局的学习策略,利用上述方程将布局深度图分解为由多个局部平面构成的参数图,并进一步将尺度从参数图中分离,最终将非线性的深度预测问题转化为了平面预测问题,实现了对布局深度图的高效学习,提升了预测准确性。

其他文献

漫谈运算与基本运算律

期刊

基本运算律乘法交换律乘法结合律

碳纳米管的功能化及聚氨酯复合材料研究

聚氨酯是由聚酯或聚醚多元醇与氨基甲酸酯重复单元形成的嵌段共聚物。作为一类重要的多用途聚合物材料，它不仅拥有优良的耐磨性能、耐疲劳性、耐化学腐蚀性及高抗冲性、优异的

学位

聚氨酯碳纳米管聚乳酸热性能

边界地区的区域发展:法意阿尔卑斯山脉地区研究

利用费萨尔区域研究理论研究了法国和意大利阿尔卑斯山脉地区四个城市的发展。分析了边界的影响。边界决定着区域组织，给这些组织以某种“边界性质”。以两个法国城市（莫丹和布

期刊

阿尔卑斯山脉意大利区域发展地区研究

以局部解剖结构为基础讲解激光武器对眼的损伤

激光武器（Laser weapons）是一种定向能武器，利用其产生的强激光束，在目标表面产生极高的功率密度，使其受热、燃烧、熔融、雾化或汽化，并产生爆震波，以杀伤人员或毁坏目标。

期刊

局部解剖结构眼激光武器

机械新能源与节能技术的应用分析

近年来，我国新能源产业化发展的趋势愈来愈明显，机械工业中新能源及节能技术的推广与应用也取得了良好的成果。加强机械新能源与节能技术的研究，有助于实现新能源与节能产品的规

期刊

机械新能源节能技术应用

基于演化算法的双通带数字滤波器优化设计

数字滤波器在信息传输领域占据不可或缺的位置,广泛应用于语音信号处理、医学生物信号处理、军事雷达、以及航空航天等多个领域。数字滤波器的性能优化变得尤为重要。在设计

学位

数字滤波器结构优化遗传算法粒子群算法系数优化

CBT-I联合药物治疗伴有条件性觉醒失眠症的疗效分析

<正>国内外研究现状、目的和意义慢性失眠症的诊断与治疗经历了从症状到疾病的过程,在20世纪80年代,医学界普遍的看法是"失眠是一个症状,而不是单独的一种疾病"。随着多导睡

会议

认知行为治疗条件性觉醒慢性失眠症右美托咪定喹硫平

现实主义的反思——《大国政治的悲剧》一书评介

自国际关系理论真正成为一门学科以来,现实主义理论就以其朴素中透出深刻与说服力的风格一直占据着重要地位,在美国学术界,就曾涌现出汉斯·摩根索与肯尼斯·沃尔兹

期刊

大国政治两极格局沃尔兹《大国政治的悲剧》多极格局现实主义国际关系理论现实主义

政府在发展体育竞赛表演业中的地位和作用——以上海市为例

<正>1．研究目的由于体育赛事在打造城市品牌、提高城市知名度和影响力、加速城市建设等方面具有不可替代的作用,因此目前许多城市的政府部门都特别重视发展体育竞赛表演业。那

会议

优化公路交警中队勤务模式

近年来,随着农村经济形势的不断好转,农民出行频率、出行方式也产生了巨大的变化。为应对日趋复杂的农村交通安全形势,维护农村地区良好的交通秩序,迫切需要调整公路交警中队

期刊

交警中队勤务模式交通违法行为

基于视觉的室内场景布局估计研究

与本文相关的学术论文