基于Wireframe的平面检测与匹配技术的研究与实现

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:imafool2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人类视觉系统在感知场景几何结构上具有先天的优势,可以毫不费力的提取出场景中的点,线和平面等几何结构。如何让计算机也具有类似人类视觉系统感知外部场景结构的能力是计算机视觉领域中的一个基本问题。二维图像可以认为是三维世界在二维空间上的投影,蕴含着丰富的现实世界的三维结构信息。从二维图像中提取三维场景中的几何结构信息是场景结构解析中的研究热点。Wireframe在表示场景几何结构信息上具有简洁高效的特点,是二维图像场景结构解析中广泛采用的一种表示方式。而以往Wireframe相关工作仅采用点和线等独立的几何基元来解析场景结构,本文研究的出发点是希望采用由平面顶点构成的封闭Wireframe多边形平面来解析场景结构。这种表示方式在几何语义上不仅涵盖了孤立的点和线的信息,而且还涵盖了平面区域的几何信息,是一种更为合理高效的场景结构解析表示方式。快速准确的从二维图像中提取点和多边形平面,进而实现对场景结构的解析,对于许多计算机视觉领域比如三维重建,虚拟现实,增强现实,机器人导航等有着重要的意义。本文通过3D建模合成了一个城市建筑物场景外墙平面数据集,对不同城市街区不同视角下的外墙场景拍摄的图像进行了详细的标注,包括建筑物外墙平面的实例分割标注,外墙平面顶点标注,外墙平面封闭线框Wireframe标注等,为本文基于Wireframe的平面检测的研究提供了数据支撑。同时,对同一场景不同视角下的拍摄图像,提供了对应平面区域的标注,使得数据可以应用于不同视角图像的区域匹配任务。基于本文制作的数据集,本文主要研究内容分成如下两个部分:(1)基于Wireframe的平面检测部分。此部分搭建了用于平面检测的神经网络结构。为了获得基于Wireframe的平面多边形表示,将平面检测拆分成实例分割任务和平面顶点检测任务。主要思想是利用平面分割作为先验提取平面的所有顶点及对平面顶点排序提供依据。在平面顶点检测中,为了降低正负样本不均对顶点检测的影响,采用了focal loss作为顶点预测的损失函数。另外,引入了注意力机制,同时,采用中继监督的思想,使用高斯核函数扩大顶点的范围,使神经网络由粗及精的逐步定位顶点准确位置。通过消融实验验证了各措施对顶点检测性能的影响。最后,通过对预测的顶点进行非极大值抑制,过滤掉部分冗余的预测顶点,得到相对精确的预测顶点。为了将平面顶点连接成封闭Wireframe多边形来表示平面,提出了基于平面分割掩膜和平面顶点的封闭Wireframe多边形构造算法。另外,提出了顶点循环简化算法,进一步过滤构成单个平面的冗余顶点,最终形成平面的封闭Wireframe表示。为了衡量封闭Wireframe多边形对平面的表示质量,提出了紧凑程度指标,用于衡量输出的Wireframe多边形与标签Wireframe顶点数量之间的差异。(2)平面匹配部分。利用平面检测分支训练的神经网络作为左右视图的特征提取器,提取每个平面对应的特征描述子。提出了基于特征描述子的平面匹配算法,并展示了本文提出的基于平面特征描述子的平面匹配算法的可视化结果,分析了影响匹配结果的各个因素,证明了匹配算法的有效性。
其他文献
自MM理论提出以来,资本结构与公司业绩关系的研究逐渐构成了现代财务研究领域的重要内容,并随着资本结构理论和实证研究的发展,有关资本结构和业绩关系的影响因素也受到广泛关注。现有的文献对二者影响因素的研究主要集中于公司治理和公司特征的视角。近年来,受外部不确定事件的影响和经济政策的变化,我国资本市场中一些长期资本结构相对健康的公司,也因短期现金流不足问题出现了爆雷现象,运营难以维济。刹那间营运资本管理
学位
本文以我国沪深300指数每半年调整一次指数成分股为背景,以委托代理问题、信息不对称、信息含量理论等为基础,将调入组与备选组、调入组与调出组分别作为对比,建立双重差分模型研究沪深300指数成分股的企业在调入和调出指数后对其融资约束的影响,并以替换被解释变量与中介变量、滞后影响等方法检验本文模型的稳健性。同时,由于我国资本市场尚处于弱有效阶段,所以上市公司与市场之前仍存在较多信息不对称的情况,因此本文
学位
信息时代里流量的爆炸性增长推动着物联网的蓬勃发展,但频谱利用率低和能量供应不足等问题却严重限制了物联网继续向前的脚步。近年来,反向散射通信技术和非正交多址接入技术(non-orthogonal multiple access,NOMA)为解决相关问题提供了新的思路,其中反向散射通信技术具有低成本、低功耗、低复杂度等特点,而NOMA则允许不同设备在同一正交资源块上接入通信。基于上述讨论,本文聚焦于将
学位
近年来,随着各种移动应用的出现,无线数据流量呈指数级增长。而固定频谱接入机制已经不再适用于频谱需求暴涨、频谱资源紧缺的时代。为此,学者们提出了动态频谱接入(Dynamic Spectrum Access,DSA)的频谱利用模式,以允许次用户共享主用户的空闲频谱,提高频谱利用率。动态频谱接入主要有机会式频谱接入(Opportunistic Spectrum Access,OSA)和共存式频谱接入(C
学位
目的 探讨瑞马唑仑对鼻内镜手术老年患者术中脑氧饱和度及术后认知功能的影响。方法选择拟行鼻内镜手术的老年患者60例,随机均分为2组。对照组给予丙泊酚2.0mg·kg-1诱导,丙泊酚4 ~ 6 mg·kg-1·h-1维持,试验组给予瑞马唑仑0.3mg·kg-1诱导,瑞马唑仑0.2~ 0.3 mg·kg-1·h-1维持,2组其他麻醉诱导和维持给药相同。采用硝酸甘油0.5~2.0g·kg-1·min-1静
期刊
伴随着经济全球化的推进,世界政治、经济格局的变化深刻影响着所有国家的经济发展。近年来,中国政府面对国内外错综复杂的政治、经济环境,出台多项经济政策并灵活调整以适应中国经济发展形势,经济政策不确定性逐渐提升并对中国宏观经济造成影响。商业银行作为宏观经济政策传导过程中的重要一环,不仅直接受到经济政策不确定性提高的冲击,经济政策不确定性对社会其他经济主体的冲击也会间接对银行产生影响。因此,研究经济政策不
学位
随着经济全球化,各国资本市场对外开放和国际贸易往来的不断深入,世界各国股市间的联动效应越发显著。学者对股市联动性的研究已不再局限于发达国家股票市场,近期研究发现金砖四国股市存在联动效应,甚至发达国家与发展中国家股市的联动效应也在增强。科创板作为我国的新兴股票市场,在科创板股票纳入MSCI中国A股指数后,其与作为“美国科创板”的纳斯达克的联动性不容忽视。研究纳斯达克与科创板的联动性具有显著的价值,对
学位
随着第五代移动通信网络(The Fifth Generation Mobile Networks,5G)的商业化,第六代移动通信网络(The Sixth Generation Mobile Networks,6G)研究工作推动迅速。6G通信网络将不仅局限于传统地面网络的部署,还会扩展其覆盖至高空和海洋,实现地面、卫星、海洋、空中网络的无缝连接。目前,天地一体化网络已经成为未来6G无线网络的研究热点
学位
基金作为我国居民众多重要的投资工具之一,经过了近30年的历程已取得了飞速发展。如今我国基金市场中已有诸多不同类型:股票型基金、债券型基金、混合型基金、货币型基金等等,其中FOF基金作为我国基金领域的新成员,是发展相对较晚的一类产品,与国外相比还处于起步阶段(秋俭,2018)。2017年9月8日,六只FOF基金正式向证监会申报公募FOF基金并得到同意,自此我国便有了第一批FOF基金产品。随着我国基金
学位
<正>"神奇的电磁铁"选自义务教育课程标准实验教科书《小学科学(粤教科技版)》六年级下册第2单元"能量及其转换"第12课。本单元围绕能量展开,教学目标是让学生从具体事例和装置中认识各种形式的能量,知道能量之间是能够转换的。基于学生已经学习过能量形式的转换,本课将对能量转换进行更深入的探究:电能如何转换成磁能。以具体装置—电磁铁—让学生深入体会能量的转换,在探究中发现规律,得出电磁铁的神奇特性。本课
期刊