基于序列约束的视觉定位算法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:villmid
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视觉定位技术作为移动机器人自主导航的核心技术,在赋能空间位置感知方面有着重要的价值。不对环境做任何限制,只依靠运动目标携带的相机就可实现定位功能的特点,使得视觉定位系统可广泛地应用于国防领域、航空航天领域、工业领域、日常生活等场景。尤其对于卫星信号缺失,有源定位无法部署或大范围覆盖的复杂环境,视觉定位更是凭借应用场景丰富,载体类型不限,成本可控的优点,在工业界和学术界引起了广泛的兴趣。视觉里程计(Visual Odometry,VO)能够依靠前后帧图像估计位姿进而得到当前的载体位置。传统VO方法过程复杂且定位精度严重依赖特征点的检测跟踪。此外,更换平台需对相机标定并重新整合各模块才能保持良好效果。现有机器学习类视觉定位算法多关注相邻两帧图像间的几何运动关系,计算量大,且常常由于无法提取关键特征造成过拟合现象使之无法在新的环境中保持性能。论文将围绕提高模型定位精度,泛化性以及实时性展开,主要研究内容如下:1.设计的深度注意VO算法,能够实现相邻两帧图像的位姿估计。输入数据为光流,四分支的网络架构充分考虑单帧图像中像素空间上的特征关联性,并通过特征蒸馏和自注意方法对关键运动信息进行提纯和精炼。最终,拟合精细化后的四分支几何特征获得位姿。相较于当前经典的学习类方法,该算法能够保持良好的泛化性能,分别在位移误差和旋转误差方面降低了12%和26%。在CPU上的运行速度高达12帧/秒。2.设计的基于序列约束的VO算法,能够实现连续多帧图像间的位姿估计。输入数据为多帧原始图像,端到端的序列学习网络架构在处理空间维度上的几何特征信息的同时考虑时间维度上的相关特征。此外,引入序列约束模块从局部一致性的角度对前后帧间关联的几何运动特征进行指导和修正。相较于深度注意VO,该算法提升了运行速率(在CPU上14帧/秒),同时位移误差和旋转误差分别降低了23%和9%。此外,跨数据验证了该算法在新环境中依然能够保持良好性能。综上所述,论文设计了两套视觉VO算法,对比论证了局部图像序列间的空间点共视关系对位姿预测的重要指导意义。并组织了大量定性和定量的对比实验评估论文所设计模型的定位精度,泛化性和计算速度。
其他文献
随着现代无线通信技术的迅猛发展,物联网已经渗透到人们生活中的方方面面。物联网中各个行业独立发展缺少交互,因此各设备及其提供的服务均具有较强的异构性,设备的识别控制、服务匹配以及消息传输方面都会遇到众多复杂的问题。解决上述问题的核心在于解决异构问题。本文对物联网中设备属性进行分析研究,提出了一种基于功能属性的设备描述机制,基于该设备描述机制,设计了异构物联网系统中设备服务的识别、注册、控制及匹配架构
近年来,随着车联网和无线技术的发展,车载信息娱乐应用的不断涌现,车联网中内容需求也正以惊人的速度增长。为了满足车联网中如此高的内容需求,边缘缓存技术得到了广泛的关注。通过在网络边缘,如基站和路侧单元上部署缓存资源,在边缘节点上缓存部分流行内容以提供内容下载服务,能够有效缓解核心网络压力,减少内容请求时延。然而,由于边缘节点缓存资源有限、内容请求分布不均匀以及车辆高速移动导致网络拓扑动态变化等问题,
图像融合是图像处理领域中的一个重要分支,可以将来自不同的传感器对于同一场景中的信息采集后得到的图像数据进行处理,保留各自数据中的有用信息并剔除掉冗余的信息,得到含有集成信息的高质量图像。图像融合在军用和民用领域都发挥着重要的作用。深度学习目前发展势头迅猛,在图像处理领域具有非常广泛的应用,但是在图像融合领域,深度学习方法对比传统方法并没有明显的优势,原因主要有两点:一、图像融合领域没有绝对意义上最
近年来,利用深度神经网络(Deep Neural Networks,DNNs)进行医学图像分割取得了显著的进展。然而,深度神经网络通常需要大量的数据和标注进行训练,对于医学图像,图像采集设备及患者隐私等问题导致数据与标注都代价高昂且难以获取。为解决此问题,本文提出了一种基于距离度量学习(Distance Metric Learning,DML)的小样本(单样本和少样本)医学图像通用分割框架。现有的
计算机断层成像(Computed Tomography,CT)是一种通过X射线扫描待成像物体并采集投影数据实现内部结构成像的技术。由于X射线对人体健康的危害大,近年来,学者们研究利用传统CT重建方法基于稀疏角度X光重建CT,进而降低X射线使用剂量,但是在两个角度的重建中无法生成可理解的断层图像。而基于深度学习的图像重建方法对X光在二维空间的变化提取能力有限,且不同角度的重建结果不一致。本文通过分析
随着多媒体技术的不断发展和进步,以视频监控、远程会议和高清电视为代表的视频应用在人们的生产生活中发挥着重要的作用。然而由于当前计算机和网络系统中传输带宽、存储空间、系统输入输出性能等因素的种种限制,很多视频系统普遍存在着分辨率较低和图像质量差的问题。为了提升视频帧的图像分辨率和整体质量,视频超分辨率技术受到越来越多研究者的关注。视频超分辨率旨在通过对低分辨率视频进行一系列技术处理,增加其像素密度并
随着市场经济与科学技术的迅速发展,在人工智能的强大引擎驱动下,井喷式的出现了大量的机器学习应用场景。而监督学习表现良好则需要大量的有标签的标注数据,该任务开销庞大且繁琐无聊,故迁移学习在智能时代受到越来越多的关注。在迁移学习的相关技术中,多源领域自适应是重要的关键技术之一。多源领域自适应研究如何通过利用多个源领域知识学习目标领域,加强领域自适应能力,缓解了负向迁移。近年来,得益于人工智能和计算机视
近年来,通过计算机视觉的方法对目标物体表面进行三维重建一直是研究热点。本文以市场上常见的激光双目三维成像系统为研究对象,对该系统中涉及的关键技术:立体匹配和点云拼接,展开深入的研究,提出了重建过程中的关键步骤的优化思路,并根据优化的思路方法设计了针对性的实验来验证算法的有效性。具体来说,在立体匹配的激光光条中心提取的阶段,提出了利用方向模板的方法来优化灰度重心法在激光光条走向变化较大时的光条中心提
纳米电介质是一种具有性能可编辑潜力的新型电介质,其通过在聚合物基中均匀填充纳米颗粒可以获得优异的介电特性,被认为是未来最有潜力的电介质材料。然而,纳米填料团聚会导致纳米电介质无法达到预期的性能,甚至导致纳米电介质性能的严重退化。目前,团聚对材料的影响程度很难量化,是一个亟待解决的难题。使用扫描电子显微镜(SEM)拍摄纳米电介质图像并进行处理是一种分析团聚现象的有效手段。然而,受限于该领域图像处理的
叶面积指数(Leaf Area Index,LAI)是衡量植物生长状况的一个重要参数。它也是农业科学、生态科学、遥感科学中众多数学模型的基本参数。叶面积指数(LAI)控制着水、营养和碳循环中的许多生物和物理过程,被定义为单位地表面积的单侧绿叶面积。针对当前主流的LAI间接测量法具有误差大,精度低,稳定性低等缺点。本课题基于摄影法,将计算机视觉技术应用到LAI测量中,开展从单视角顶视法和多视角精确构