基于三维点云的场景语义分割

来源 :上海工程技术大学 | 被引量 : 0次 | 上传用户:liuyc077
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着激光雷达等采集设备性能的不断提升,三维点云获取变得越来越便捷,其在机器人、智能驾驶、室内导航等领域得到广泛应用。在计算机视觉中,语义分割是场景理解的关键技术之一。传统的基于二维图像的语义分割算法严重受限于图像拍摄角度及光照等不可控因素,且易丢失场景中物体间的空间位置关系。为充分理解现实世界,利用三维点云以实现场景语义分割成为当前的研究热点。因点云的不规则、无序、稀疏等特性使得基于图像的卷积神经网络难以被直接应用,故研究者尝试多种转换方法,虽取得了较优的分割效果,但会造成计算复杂、内存占用大等不足。针对Point Net网络的缺陷,本文以Point Net为主干网络提出了层间共享的注意力网络(ILSA),其主要是在原有网络基础上添加了两个关键性的模块以提高点云语义分割性能。通过实验验证,ILSA网络在室内数据集的分割效果良好。本文具体工作如下:(1)原有的Point Net网络仅仅是利用多层感知机获取点云的全局特征,而此类特征体现的是场景的整体属性(例如:颜色、纹理、形状等)对于准确分割及理解场景是不充分的。为提高模型分割性能,本文在此基础上对场景中局部区域的细节信息(边缘、角、线等)进行采集,并将其与全局特征融合以实现上下文特征的提取,提出了层内层间共享模块。该模块由三个分支构成,每个分支使用不同空洞率的卷积获取多尺度的场景特征,且各分支通过短连接相连。同一分支上的前后两个特征图能够相互集成,不同分支上的特征图能够被编码到后续的分支。(2)为充分感知现实世界,高效分割室内场景,本文考虑三维语义场景中各物体之间的空间位置布局,提出了空间注意力模块。该模块引入注意力机制,使网络能够快速定位感兴趣的区域,同时获取相邻物体间的相关性,从而有效区分二者之间的语义关系,提高分割的准确性。在斯坦福室内数据集(S3DIS)的语义分割实验表明:该算法鲁棒性强、可靠性高,相比于Point Net,其在各个类别上的分割精度都有提升。
其他文献
随着深度学习在计算机视觉任务中的逐渐普及,多目标实时检测、模型优化、跨相机追踪等技术在各个领域的应用也愈发广泛。辅助驾驶作为目标检测的首要落地方向,已经成为当下的研究热点。但在某些复杂场景中依然存在一些问题,例如车辆过于密集导致检测的精度过低、模型内存大无法实时推理、跨相机追踪目标易丢失等。基于此,本研究以辅助驾驶为应用场景,对多目标的实时检测模型及优化、跨相机追踪等算法进行设计,实现速度与精度的
学位
随着互联网的发展,消费者开始习惯于网上消费,网红食品作为近几年新兴的线上食品越来越受到消费者的青睐,研究网红食品消费者的态度和行为是迫切需要的。在网红食品研究领域,学者们多以调查问卷的形式展开研究,但调查问卷的方式缺乏灵活性,调查的回收率和效率较低,因此本文基于大数据技术对网红食品的在线评论进行分析。本文通过网络爬虫技术采集了“大众点评”上关于网红食品的10个城市38家店铺的消费者在线评论。经过数
学位
温室气体的大量排放导致了气候变化,进而引发了一系列被广泛关注的气候灾难性事件。石油和天然气行业是温室气体的主要排放来源,其在减少温室气体排放中起关键作用,因此分析石油公司应对气候变化态度及低碳转型是一个重要的问题。本文获取了BP公司、埃克森美孚、壳牌集团、雪佛龙、挪威国油、道达尔、埃尼集团共七家国际石油公司2010-2020年间公开发表的气候变化语句137963条。首先,利用共现网络模型,分析石油
学位
生活垃圾产生量和堆存量剧增,导致环境污染、气候变化等一系列问题,严重威胁居民的生活健康。与此同时,“城市矿山”概念兴起也使人们意识到垃圾中蕴藏的资源价值,将垃圾分类回收是城市生活垃圾管理的必要途径。北京市虽然实施垃圾分类政策多年,但收效甚微,垃圾产生量居高不下、垃圾可回收利用率低。本文对北京市居民进行深度访谈和问卷调研,构建城市居民垃圾分类的驱动模型,运用结构方程模型分析影响居民垃圾分类意向和分类
学位
近年来,四旋翼无人机在疫情防控、农业生产、精细化巡检、国防与社会安全、航拍等领域中发挥着重要作用,这种能够垂直起降、自主悬停、具有一定载物功能的无人飞行器凭借其自身的强大优势受到越来越多的关注。四旋翼无人机通过姿态变化来实现运动状态的改变,为了保证四旋翼无人机的稳定飞行,四旋翼无人机需要根据实时获取的姿态信息进行适当的调整。因此通过无人机机载传感器获取其准确的空间姿态是无人机稳定控制的必要条件,更
学位
在计算机视觉领域,兴趣点检测和描述符提取是获得图像特征的一种方法,广泛应用于图像配准、三维重建和视觉跟踪等视觉任务。传统的兴趣点检测和描述符提取方法通常是根据局部像素变化而设计的,其存在匹配效率和准确率不高、受图像的光照和角度等因素影响较大的问题。然而深度学习在视觉领域发展迅速,在计算机视觉任务中取得长足进步,于是学者们逐渐开始基于深度学习的兴趣点检测和描述符提取研究。本文提出一种新的兴趣点检测和
学位
滤波器组多载波(Filter Bank Multi-carrier,FBMC)传输技术是目前第五代移动通信物理层新波形技术的优秀候选方案之一。相对于传统的基于循环前缀(cyclic prefix,CP)正交频分复用技术(Orthogonal Frequency Division Multiplexing,OFDM)它最大的特点是利用具有时频聚焦特性优良的原型滤波器来构建系统,因此不需要循环前缀就可
学位
无底价拍卖已成为当前炙手可热的拍卖方式,无底价拍卖即商家对拍品不设置低价,由竞拍人依次向上报价,最终出价最高的竞拍人获得拍品,普遍应用于中低档价值不高的拍品。无底价拍卖以1元起拍以及不设保留价吸引了买家的目光,而加价幅度作为无底价拍卖卖家设计的最重要的因素,在一定程度上决定了拍卖的成交价格,加价幅度设置不合理会导致拍品以不符合它本身价值的价格成交,从而影响商家或竞拍人的利益。因此本文试图从拍卖双方
学位
油气资源是我国实现2030年碳达峰、2060年碳中和目标过程中,淘汰替代煤炭等“高碳”化石燃料所需倚仗的重要物质基础。科学、系统地评价我国油气勘探开发行业的资源配置效率,是油气勘探开采过程中开展资源配置优化分析的前提。本论文首先采用Bootstrap-DEA模型替代传统DEA模型对油气勘探开发行业的资源配置效率开展评价;接着基于对技术效率的分解,使用投影分析开展油气资源投入过剩与产出不足时的分析;
学位
近年来,随着人们的室内活动不断丰富,定位场景也不再局限于室外环境,室内以及室内外相结合的定位场景需求也在不断提升。在室内外相结合的定位场景中,室内与室外定位技术实现无缝结合才能更好地满足用户的需求和体验。但是,室内定位与室外定位是相互独立的定位系统,如何有效地解决室内与室外定位方法之间的准确稳定切换,则对室内外无缝定位的发展有着很大的影响。同时,在室内定位场景中,除了定位精度以外,定位效率也应当成
学位