主动式场景扫描重建与语义分析技术研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:mqshi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
场景重建与语义分析理解是计算机视觉、计算机图形学以及机器人学中的难点。随着工业和娱乐领域对数字几何需求的不断增长,对场景进行建模与分析理解比过去任何时候都更加重要。近年来深度扫描技术的快速发展使得场景的数据建模越来越便捷,由于这一技术的革新,场景的重建和语义分析技术经历了由简单到复杂以及由低维到高维的发展演变。另一方面,移动机器人经过多年的研究和发展,已经逐步走向实用化,在制造业、物流业、服务业等传统领域,已经有不少使用移动机器人提高生产效率或者替代人工作业的实例。在场景重建和语义分析领域,目前三维数据的获取几乎都是通过人工扫描完成的,而对于大规模复杂场景来说,人工扫描无疑是一项非常繁重的工作,耗费了大量的人力物力。此外,数据采集过程中由于缺乏主动式的分析和引导,往往导致采集的数据信息不完整,从而失去了建模与分析的价值。针对上述存在的问题,本文研究了未知环境下机器人主动式场景扫描重建与语义分析技术。在场景扫描重建方面,本文研究了未知环境下主动式场景自动扫描重建的方法。在场景语义分析理解方面,本文研究了主动式场景语义分割技术。在场景物体分析方面,本文研究了复杂环境下单个物体识别的方法。论文主要创新点包括:1.基于张量场引导的机器人自动导航规划:目前基于场引导的路径规划算法大多采用了向量场。但向量场由于存在局部极值点等问题,很难被广泛应用。本文首次将张量场引入机器人导航规划问题,提出了一种基于张量场引导的机器人自动导航规划算法。相比于传统的向量场(如势场),张量场具有奇异点少、无局部最优陷阱等优点,生成的局部路径天然地具备避障的功能,而且平滑稳定。同时张量场良好的拓扑特性具有全局路由引导的功能,在整体上极大地提高了机器人探索场景的效率。在张量场的引导规划下,本文设计实现了一个机器人自动扫描系统,并在多个虚拟和真实场景中做了大量测试。实验结果表明本文方法的扫描效率显著优于以往的机器人自动扫描系统。2.面向高质量重建的相机3D扫描轨迹优化:相机的扫描轨迹对场景重建质量的影响极大。高质量的重建要求相机视角能够尽可能的垂直于观察区域的表面,同时还必须保证相机扫描过程的平稳。除此之外,由于相机是固定在机器人手臂上或者其顶部,相机的轨迹还需要满足机器人本体的运动模型约束。针对以上条件和约束,本文提出了一种相机3D扫描轨迹优化算法,该算法将各个约束项形式化成一个能量方程,然后通过最小化能量方程来求解轨迹。优化该方程的难点在于其高度非凸性,难以求得解析解,本文巧妙地将其转化成一个线性规划问题,实现了对轨迹的求解。优化得到的轨迹不仅保证了高质量的重建效果,而且在很大程度上提高了扫描效率。大量实验结果也验证了该算法的有效性。3.机器人主动式场景感知与语义分析:现有关于场景的语义分析的相关工作大多采用被动式处理方式,即基于离线采集好的RGBD图片序列进行分析。而这种方式极大地限制了对场景语义分析的性能。针对该问题,本文提出了一种机器人主动式场景感知与语义分析算法。该算法首先提出了一个新颖的增量式语义分割网络,能够对场景进行在线处理与语义分割。借助于该网络。本文引入了语义分割熵的概念,然后基于语义分割熵与几何重建熵来规划机器人下一个最优视点,引导机器人的观测移动。为了提高扫描效率,我们优化计算了视点之间的连续扫描轨迹。该算法在大型虚拟数据集上进行了测试,实验表明本文算法能够高效地分析得到场景高质量的语义分割结果,并且效果显著优于目前已有的几种先进算法。4.复杂环境下单个物体细粒度识别:复杂环境下单个物体的细粒度识别非常困难,目前已有算法大多采用单张图片识别的方式,对视角要求较高,识别效果往往不佳。针对该问题,本文提出了一个以物体细粒度识别为目标的3D注意力网络模型,该网络模型能够引导机器人进行连续多视角的数据采集,然后借助于多视角的数据综合判断物体的具体类别。为了充分利用和融合多视图的信息,本文采用了递归神经网络对多视图数据进行融合,有效地提取出了用以区分物体的关键性特征。为了验证本文算法的有效性,我们设计实现了一个机器人主动式物体识别系统,结果表明该系统能够准确地识别场景中的物体,完成对场景的语义解析。
其他文献
通信技术和传感器技术的发展让智能移动终端拥有越来越强大的计算、感知、存储和通信能力,随着这些智能移动终端设备的爆炸式普及,移动群智感知(Mobile Crowdsensing,MCS)作为一种新兴的感知模式应运而生,它将众包思想与移动感知相结合,通过大量智能移动终端的不断移动和广泛参与完成大规模复杂感知。与传统的传感器网络相比,MCS具有部署成本更低、系统构建更加快捷、维护更容易、更具有可扩展性、
装备技术体系是武器装备体系在技术视角下的延伸,是装备技术整体规划的重要理论基础。装备技术体系的理论研究必须以钱学森的系统科学思想为指导,对装备技术体系的战略探讨、生成方法、结构建模、体系评估以及发展预测等方面进行研究。现有研究的主要问题包括:第一,虽然以德尔菲为代表的专家法取得了广泛的应用,但存在论证周期长、成本高、覆盖不全等缺陷;第二,虽然多视图体系结构框架设计了完备的视图产品和元模型,却没有给
同步定位与建图(Simultaneous Localization and Mapping,SLAM)是指机器人在未知环境中移动时利用所搭载传感器的观测数据进行场景地图构建,并同时估计机器人在地图中的位置及运动轨迹。随着低成本三维视觉传感器(RGB-D相机)技术的成熟,三维视觉SLAM技术成为机器人领域和计算机三维视觉领域中新的研究方向。本文以实际应用需求为牵引,利用RGB-D相机可同时采集彩色图
随着大数据和硬件计算资源的发展,人工智能当前进入了深度学习时代,深度学习时代具有两个最为显著的特点:一是计算量大,二是在多个应用领域效果远超传统方法。传统的人工智能方法虽然计算量相对较少,但是其性能遇到了天花板,很难进一步提高,而目前来看深度学习只要数据量足够,通过合理的网络设计以及足够的计算其在性能上往往都具有非常高的潜力。为了获得足够的深度学习计算加速,当前展开了各种硬件竞赛,比如GPU上针对
机器学习作为人工智能技术的核心支撑受到了广泛的关注。数据规模不断增长,对最优化方法求解机器学习模型带来了新的挑战。本文以提高随机最优化方法在大数据条件下的收敛速度和精度为目标,针对随机梯度降噪算法计算效率低、自适应梯度方法泛化能力低、随机拟牛顿方法收敛速度慢、基于随机梯度下降的Lookahead方法调参要求高等问题,从随机梯度下降算法的弹性降噪、自适应梯度方法的边界调度、随机拟牛顿方法的降噪加速、
随着近年来国内外多条商业运营线路的开通,磁浮列车逐渐成为轨道交通领域研究和发展的热点和焦点。高速磁浮列车作为一种新型轨道交通制式,对于解决大城市间的快速交通问题,建立和完善我国高效立体的高速客运体系具有重要意义。本文以时速600公里高速磁浮列车悬浮系统为研究对象,对悬浮系统的性能优化问题展开研究。论文针对高速磁浮列车悬浮搭接结构建立数学模型,并根据模型特性设计标称控制器。由于高速磁浮列车长期运行过
计算机生成兵力(Computer Generated Forces,CGF)是作战仿真领域的关键前沿技术之一。意图识别行为是CGF认知行为建模的重要研究方向,可有效解决现有模拟仿真系统中CGF行为模式固定可预测、对抗与协同能力不足、态势分析与处理水平低等问题。策略型意图识别行为建模是考虑战场竞合关系条件下,对一般意图识别行为的泛化研究,有助于CGF更富策略性地识别敌友作战意图。研究面向CGF的策略
动态目标防御技术是一种新型的网络安全技术,通过构建、评价和部署多样化、不断迁移并且随时间变化的机制及策略的方式,增加攻击者的攻击难度及代价,有效限制脆弱性的暴露及被攻击的机会,提高系统的弹性。本文结合新一代网络架构SDN直接灵活、集中式的网络控制能力优势,对动态目标防御网络的相关关键技术进行了深入研究,主要研究工作及创新点如下:对于基于SDN的路由随机变换技术,本文分析了路由随机变换的相关问题,从
随着人们对互联网的依赖日益加深,保证互联网正常且稳定地运行是社会稳定运行的前提。但随着网络安全威胁技术不断升级,新的网络安全威胁不断涌现,网络安全面临较严峻的形势。而网络规模的不断增大,网络流量数据规模的增大,给网络流量的分析和异常检测带来了许多困难。因而,如何实时准确地发现大规模网络中存在的网络流量异常行为,保障网络正常且有效地运行,对提高网络的可用性和可靠性具有重要的意义。目前网络流量异常检测
近年来,人工智能技术迅猛发展,在全球范围内受到了广泛关注。以卷积经网络(Convolutional Neural Networks)、图卷积神经网络(Graph Convolutional Neural Networks)为代表的深度学习算法的不断更新迭代对计算机系统的计算性能与能耗要求急剧提高。然而,由于近年来摩尔定律发展的停滞以及冯诺伊曼结构限制,现有的数据中心架构无法高效地实现深度学习与大数