融合回转结构的语义SLAM方法研究

来源 :陕西科技大学 | 被引量 : 1次 | 上传用户:hzh19780101
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
智能机器人需要理解周围环境的几何结构以及语义信息,才能与场景进行有意义地交互,在视觉SLAM(Simultaneous Localization and Mapping,简称SLAM)中利用场景的特殊结构与语义信息,已被证明是视觉SLAM的一种很有发展前景的方向。本课题提出一种融合回转结构的视觉SLAM方法,主要创新点包括两个方面:1)、提出深度学习与传统图像分割算法结合的回转体外轮廓自动分割方法;2)、融合回转结构的视觉SLAM方法总体框架,以及回转结构真实尺度与位姿融合方法。本课题在传统视觉SLAM的基础上,融合了回转体结构与语义信息。首先,通过训练Mask R-CNN(Regional Convolutional Neural Network,简称R-CNN)回转体识别与分割网络,结合传统图像分割方法,提取回转体外轮廓;其次,根据回转体成像外轮廓,利用回转体成像特殊几何约束,建立其比例模型;最后,设计融合回转结构的SLAM系统框架,提出回转体真实尺度与位姿融合方法,建立结构语义SLAM地图,说明了回转体语义信息对SLAM后端闭环检测的帮助作用。本文的具体工作可总结如下:(1)回转体检测与分割。为了让计算机理解图像中的回转结构,本课题从网络上收集回转体照片,包括花瓶、瓷器、水杯等类别,并使用图像标注工具进行手工标注,建立回转体图像数据集。使用此数据集对Mask R-CNN物体识别与分割网络进行训练,得到回转体识别与分割模型。将Mask R-CNN回转体分割结果,作为Grabcut主动式图像分割方法的先验,得到回转体轮廓初始分割结果;随后在回转体区域进行Canny边缘检测。最后,将Mask R-CNN回转体分割结果,Grabcut分割结果以及Canny边缘检测结果融合,实现回转体的自动分割,并得到图像中回转体的语义类别信息。(2)基于单张照片的回转体比例建模。在回转体成像过程中存在特殊的几何约束,本课题根据单张照片中的回转体外轮廓信息,利用回转结构成像特殊几何约束,构建回转体比例模型。首先,从回转体成像外轮廓中拟合回转体上下椭圆方程;其次,根据回转体上下椭圆空间关系约束,以及回转结构与单轴旋转运动的类比,建立约束方程组,求解绝对圆锥曲线,得到相机内参;然后,通过回转体成像的一条侧轮廓与一个截面椭圆,利用回转体成像中存在的平面透射约束,求解生成曲线的成像;随后,使用截面椭圆平面的消失线、回转体成像对称轴以及相机内参,对生成曲线与对称轴的成像进行平面矫正;最后,对矫正后的生成曲线进行归一化处理,并绕对称轴旋转得到回转体比例模型。(3)融合回转结构的视觉SLAM方法。在回转体比例建模方法的基础上,设计融合回转结构的视觉SLAM系统总体框架,提出回转体真实尺度与位姿融合方法,说明回转结构语义信息对SLAM闭环检测的帮助作用,并建立融合回转结构的语义SLAM地图。基于同一回转体在不同两帧成像中,其顶面、底面椭圆中心点为匹配点对的假设,提出回转体真实尺度与位姿初始估计方法;在初始尺度与位姿的基础上,利用成像后生成曲线上的采样点,构造最小二乘优化问题,对回转体尺度与位姿进行精确求解。本课题利用深度学习方法与传统方法融合,获得SLAM视频序列中回转体的结构与语义类别信息,实现了对传统图像特征SLAM点云地图的增强。通过实验与分析表明,本文所提融合回转结构的语义SLAM方法,可用于实际SLAM场景中,能建立包含回转体语义与完整结构信息的SLAM地图,相比于点云地图,能用于更高层次的应用场景。本文方法使用图像信息完成回转体建模,并与SLAM地图融合,不依赖点云与图像特征信息,相比于基于点云分布的回转体识别再增强方法,回转体建图结果点云地图稀疏程度无关,能用于特征缺失以及包含透明回转体的场景,同时具有场景中回转体的语义类别信息。
其他文献
南苏丹在国家建设方面面临巨大的安全挑战,其中包括政治不稳定、经济损失、社会分裂、叛乱以及外部势力的参与。这些因素导致国家出现激烈的内战和独立后广泛蔓延的不安全状
本文从三种辽宁省优势产地药材-威灵仙(东北铁线莲,Clematrs mandshusica Rupr.)、玉竹(Polygonatum odoratum(Mill)Druce)和白鲜(Dictamnus dasycarpus Turcz.)原植物的植株
当下,经济全球化使得供应链愈加复杂,精益生产下供应链竞争愈加激烈。供应链网络扩展,时间上追求高效,繁荣表象之下,供应链尤其脆弱。自然灾害、人为事故、政策因素等不断对供应链造成冲击,供应链随时暴露于中断风险之下。供应链中断一旦发生,不仅造成中断企业生产经营活动无法正常进行,还会连累其他企业,造成整条供应链的波动乃至瘫痪,损害巨大。供应中断是供应链中断中最为常见的中断形式。如何有效应对,尤其在装配系统
Android平台为应用程序提供了各种权限用于访问Android平台上的敏感资源,包括网络、地理位置以及电话信息等。为了保护应用程序对于这些敏感资源的使用,Android平台自身提供
目的血管性痴呆(vascular dementia,VD)是由一系列脑血管因素引起的痴呆综合征。对脑组织造成不同程度的损害,主要的临床表现是记忆力衰退,表情冷漠,呆滞和性格改变。它至少
森林质量精准提升关键在于人工林收获技术的优化,以优化杉木人工林大中径材收获技术为研究目的,以福建省杉木中心产区杉木人工林为研究对象,调查收集685块固定样地和临时样地
鼻敏感颗粒处方为江苏省中医院名老中医干祖望的临床经验方,由黄芪、干姜、桂枝、麻黄、五味子、乌梅、甘草等七味药组成,具有益气温阳、宣通鼻窍之功效,临床上用于治疗鼻敏
QARMA算法是在TOSC 2017上发布的一族带有Tweak的轻量级分组密码算法,它有64与128比特两种分组长度的版本,分别记为QARMA-64与QARMA-128。设n是分组长度(n可取64与128),此时Tweak的长度为n比特,密钥长度为2n 比特。设计者声明QARMA-n可提供2n比特的安全性。目前,针对QARMA算法有一些分析结果。Zong等人在2016年对QAR-MA算法进行了中间
由于数字图像通常会因为硬件原因被脉冲噪声所污染而导致图片质量变差,在工业应用中脉冲噪声的去除研究成为图像处理中的一个重要问题。本文的主要研究内容在于提出更好的脉冲噪声去除算法。我们首先提出了一个新的基于紧框架的变分模型,该变分模型采用紧框架正则项和l_1-l_2非凸保真项。通过加入若干辅助变量,我们将原来的非约束问题转化为约束问题。然后使用交替方向乘子法(ADMM)得到一个求解该模型的有效算法。在
本文以东天山觉罗塔格带东段早志留世花岗质岩石为研究对象,在详细的岩相学研究基础上,通过LA-ICP-MS锆石U-Pb定年、全岩主微量元素和Sr-Nd同位素分析结果,讨论了早志留世花