基于深度学习的视觉测程定位方法

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:hbh0429
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
同步定位与地图构建(Simultaneous Localization and Mapping,SLAM)是机器人领域的重要研究问题,实现了机器人搭载相机和激光雷达等传感器在未知环境中对自身定位同时构建地图的任务。近年来,随着增强现实和自动驾驶等应用的兴起,视觉SLAM(Visual SLAM)研究受到了广泛的关注。VSLAM以图像作为主要感知信息源,通过多视图几何理论估计相机位姿和构建3D场景。视觉里程计(Visual Odometry)可以说是VSLAM最重要的组成部分,是自我定位和地图绘制的基础工作。近年的工作表明,可以使用未标记的单眼视频来训练深度预测和自我运动估计的卷积神经网络。但是,由于缺乏适当的约束,网络在不同样本上输出比例尺不一致的结果,即,由于每帧比例尺的歧义性,自我运动网络无法在较长的视频序列上提供完整的摄像机轨迹。本文基于深度学习方法设计了一种端对端的视觉里程计网络,组件为相机自我运动估计网络和图像深度预测网络,原理为通过预测的深度和自我运动将一帧图像变形为另一帧图像,利用图像重建损失作为监督信号来训练网络,整个过程可以利用双目视频序列,也可以只在单目视频上进行训练,而在单目视频上训练时,整个网络便是完全无监督的。在传统的视觉测程定位方法中,往往利用训练视频本身的环路检测来辅助校准自我运动。但在深度学习方法中,长视频的环路检测变得难以实现,因此本文提出了在10帧以内的相关帧中构成环路并使自我运动与环路的不匹配性也加入监督信号的方式来辅助训练。这一想法同时解决了深度预测网络与自我运动估计网络在尺度上不一致的问题。在KITTI数据集上的测试结果表明,局部环路检测的加入使自我运动估计的准确度大幅提高。我们的视觉测程精度与使用立体视频训练的最新模型相比同样具有竞争力。最后,本文在CNN能从单目图像提取到相对深度信息的启发下,提出了物体大小估计网络,对单目图像中的物体实际大小进行估计,以获取现实尺度与图像像素的对应关系。通过与之前训练好的深度预测网络进行比对,获取深度预测结果与现实尺度的比例,进一步地,将这一比例应用在自我运动轨迹上,以做到从单目视频序列预测出具备现实尺度的自我运动轨迹。
其他文献
当前,分布式流处理系统中的处理逻辑变得更加复杂,数据流图规模变大,图拓扑结构较为复杂。现有的流处理资源管理器中的启发式调度规则不够灵活,调度效果较差,影响了流处理系统性能,现有的节点调度算法难以在大规模流处理任务上取得较好的调度效果。本课题中,针对如何对流处理应用中的大规模数据流图节点进行资源调度,提高分布式流处理系统处理效率的问题,采用了深度强化学习与多级图划分技术,从两个方面进行了研究,设计并
利用多智能体协同决策算法可以在多智能体系统中协调多个智能体的资源和活动来实现共同的目标,其在智能交通系统、智能电网系统、无线传感器网络和无人机群协同控制等领域有广阔的应用前景。其中,以马尔科夫决策过程为基本模型的多智能体深度强化学习类方法在解决机器人协同控制问题时取得了较好的表现。该类方法的特点是具备基于观测数据更新的在线学习能力,在端侧应用时对环境具有较好适应性。但是,由于端侧嵌入式处理器的计算
智能钻探技术具有智能化、自动化的优点,在现今和将来都是钻探领域的研究热点。为结合大数据和深度学习,智能钻探技术需要大量的数据为其提供支撑,因此服务于智能钻探技术的数据采集单元具有重要的研究意义。但是现今智能钻探系统的研究还不够成熟,井下的测量仪器大部分是分立化且功能单一的,不利于智能钻探系统进行数据收集。此外,井下恶劣的工作环境、钻探工作产生对测量造成的干扰、体积、功耗等限制给井下数据采集带来了现
人类以对话的方式询问信息,当前询问的问题通常与之前的问答存在关联。然而当前的机器阅读理解任务更多是单轮问答,不同轮的问题和答案没有相关性,可以独立的求解。为了使得机器具备像人一样询问信息的能力,研究者提出对话式阅读理解任务,给定一篇文章和多轮问题,当前轮问题的回答不仅依赖于文章内容,还需要结合当前轮次的问答历史信息。本文探究融合问答历史信息的机器阅读理解技术,即在结合文章回答当前轮问题的过程中融入
随着人工智能的快速发展,卷积神经网络在自然语言处理、计算机视觉、医学治疗等任务中扮演着至关重要的角色,尤其在计算机视觉领域取得了令人瞩目的成绩,例如目标检测、特征识别、图像检索等。但是,随着卷积神经网络在应用上的愈发深入,其结构愈发复杂,模型的计算量更是指数级上升,其对算力和存储空间的要求也越来越高。在过去半个世纪,集成电路的发展受到摩尔定律的限制,硬件计算力的提升远远满足不了人们对计算力的需求。
手和手腕在人们日常的工作、学习和生活中起着至关重要的作用,人类大部分活动都离不开手的参与。因此,研制一款轻巧、灵活、便捷的假肢手/腕系统将会给上肢残疾人士的生活带来巨大的便利。一些欧美国家早在20世纪中叶便开始对假肢进行研究,我国在这方面起步较晚,技术相对落后,因此研制一款先进的仿人智能假肢手/腕系统对于提升我国假肢的研发能力显得格外重要。本文根据HIT-VI假肢手和手腕的机械结构与功能需求,设计
随着深度学习技术的进步,深度神经网络在诸多领域大量应用,其可解释性问题日益受到人们的广泛重视。目前深度识别网络缺乏数学理论支撑,存在机理不明确的问题,难以对目标识别的风险性、可靠性、适应性、鲁棒性进行准确评估,从而限制了模型的实际部署与应用。因此展开对深度识别网络的可解释性方法的研究迫在眉睫。为此本文在深入研究可解释性包含的内容的基础上,从基于可视化、基于局部近似、基于黑盒测试这三个方法层面对深度
燃烧过程中高温火焰的温度分布不仅能直接表征火焰的三维结构,还可以作为先验知识对燃烧过程的进行预判,具有深刻的指导意义。火焰层析成像技术以其易于实现和非侵入性等优点,在燃烧监测和诊断中发挥着重要作用。然而,由于传统迭代方法的数据量大、耗时较长。因此,本文建立了一种基于深度学习的火焰三维温度快速层析重建和预测的模型,训练后具有快速重建和预测的能力。建立并验证了基于视在光线法的辐射传输模型,建立了考虑辐
光作为一种承载目标信息的载体在很多方面都有很重要的应用,在日常生活中,错综复杂的环境会影响我们对目标信息的获取和判断。本课题对现有的多种从不规则散射光场中获取信息的技术进行分析及研究之后,为了解决现有的散射介质后目标分类方法适应性和鲁棒性差这一缺点,最终选择散斑自相关方法来处理散斑并获得隐藏在散射介质后的目标物体信息,为了解决传统特征提取和分类算法效率低这一问题,选择利用卷积神经网络对处理后的散斑
冲压发动机自发明以来被世界各国广泛运用到超声速领域,具有比冲高、结构简单,经济性高等优点。冲压发动机在世界各国的国防军事领域都有着举足轻重的地位,尤其是欧美等军事强国一直在致力于开展冲压发动机的技术研究。随着冲压发动机工作范围拓宽、飞行距离更远等需求发生改变,仅考虑燃油可调单一变量控制的冲压发动机已经无法适应新环境和新的作战需求。本文针对固定几何结构冲压发动机面临的问题,考虑引入进排气可调的结构,