复杂场景下的多视角三维场景定位研究

来源 :北方工业大学 | 被引量 : 0次 | 上传用户:glx19891006
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在人工智能飞速发展的时代,人们对智能机器人、自动驾驶、室内导航等服务的需求越来越多,研究者们对这些领域进行了深入研究。这些领域都有一个共同的基本问题——如何较为精确的对相机自身进行定位。CNN在相机自定位中有较好的表现,但是依然存在精度低、错误率高的问题。其中一个重要原因是对位置、角度这两类不同参量的统一化处理。为了提升现有三维场景定位算法的定位精度,本文提出了两种基于深度学习的端到端的方法从单张彩色图像中恢复相机的位置和姿态。本文主要工作及创新之处总结如下:(1)提出一种双路编解码场景定位网络(DSEDL-Net),双路结构的设计解耦了位置与角度,解决了两者之间的串扰问题。由于相机位置和姿态的特性不同,该网络使用多任务思想将位置和姿态使用双路结构分别进行预测,从而得到更可靠的结果。提出使用单尺度降采样模块和多尺度聚合模块的位姿预测器对解码后的特征进行转换,配合使用全局均值池化操作捕捉特征的空间信息,起到减少信息损失的作用。(2)提出一种基于联合任务学习的场景定位网络(JTL-Loc Net)。DSEDL-Net解耦了位置与角度,但两者并不是完全孤立的,因此JTL-Loc Net引入注意力机制的门控模块,选择并传递对于不同任务需要重点关注的信息,这些信息同时也是一种全局特征,克服了卷积网络卷积操作局部性的缺点,使不同任务之间得到信息共享;此外,JTL-Loc Net在DSEDL-Net基础上,增加辅助任务支路,提升了网络性能,辅助任务分支(如裁剪坐标,旋转角度或缩放因子)在位置解码器后嵌入,对于小规模数据集,辅助任务可以看作网络中一个正则化项,它提供了先验知识,通过添加约束的方式来缩小假设空间,加速网络的收敛。(3)在具有挑战性的公开的室内和室外场景数据集上进行了充分实验,证明了本文所提方法的有效性。在室内Microsoft 7-Scenes数据集上,本文DSEDLNet比“Pose Net”方法的平均位置和姿态误差分别减小了47.7%和21.5%,JTL-Loc Net比“LSTM-Pose”方法的平均位置和姿态误差分别误差降低了32.3%和36.5%;在室外Cambridge Landmarks数据集上,本文JTL-Loc Net平均位姿误差比“Pose Net”降低了44%和64%。综上,本文所提的两种网络在公开的室内和室外数据集上均达到了良好的效果,证明了本文所提方法用于多视角三维场景定位任务的可行性和有效性。
其他文献
ERP(Equi-Rectangular Projection)投影格式是360度视频常用的投影格式,其靠近两极的视频图像内容存在水平拉伸并产生失真,导致了HEVC(High Efficiency Video Coding)编码器
核酸外切酶III(Exo III)由于不需要特定识别序列就能选择性识别并水解双链DNA的3’平末端或3’凹末端,它在构建DNA信号扩增的生物传感器方面有着广泛的应用。随着对小分子和
思想政治教育是一种有目的、有计划、有组织的综合教育活动,为中国特色社会主义伟大事业提供强有力的精神支撑。国有商业银行是由国家直接管控和负责的大型商业银行,承担着金融服务、金融供给和经济支持与调控的重要任务,对于促进国民经济发展和社会稳定具有重要作用。近年来,我国国有商业银行对其从业人员的队伍建设工作给予了高度重视,致力于将其内部员工队伍建设成为能够满足经济社会发展需要和促进金融服务业发展与维护社会
学位
随着经济全球化的发展,国家间贸易活动逐渐增加,蕴藏在国家间商品和服务贸易过程中的CO2排放及转移问题日益突出,成为学术研究的热门领域。文章基于世界投入产出模型,测算出
在古代,中国乡村皆有自成一体的总体性和艺术性,但随着城市化进程的不断推进,大量乡村人口涌入城市,乡村在走向衰败的同时逐渐散失其完整性与独特性。为了扭转乡村发展困局,国家陆续提出新农村建设、美丽乡村和乡村振兴等政策,乡村建设问题又一次回归人们的视野。随着乡村建设的发展,建设主体由前期的硬件“美丽化”逐步转向更深层的乡村产业提振,而美育的加入也为乡村的艺术建设助力。从乡建参与者角度,规划师、建筑师、艺
学位
随着生产力水平的迅速提升和用户日益多样化的需求,为了满足灵活多变的多品种小批量的混合生产模式,传统的流水作业车间被柔性作业车间和机器人制造单元所替代。双机器人装配
在这种情况下,使用互联网广告平台,特别是通过诸如Facebook或Yo uTube之类的社交媒体来为其产品或服务做广告的趋势,现在正成为柬埔寨市场的主要因素。据观察,许多打算使用产
20世纪中期以来,学界开始普遍意识到国家形象的重要性,并从多个方面对国家形象展开探讨研究。但这些研究多是从政治经济文化社会等宏观的角度介入,基于微观叙事分析的国家形象研究较少。本文基于近两年来参与多个国家项目设计实践经历,试图将研究视角聚焦到日常之物的细微之处,通过历史谱系梳理以及个案研究的方法,以小见大的折射日常生活之物蕴含的国家形象并对其视觉语言进行分析。本文的第二章节通过以小见大的视角就日常
学位
广西是我国最大的产糖省份之一,但我区当前糖业信息沟通方式较为落后,糖业信息沟通难、沟通成本高的问题在蔗糖开榨季节显得尤为突出。具体表现为榨季蔗农盲目砍伐,与糖厂压
脑肿瘤分割对于脑肿瘤放射治疗计划的制定和疗效评估具有重要的价值。由于脑部肿瘤具有形状多样、位置不固定、结构复杂、不同患者病理症状差异似大等特点,传统的手工分割不