基于深度学习的机器人环境感知研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:xingdeyanglina
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,深度学习技术促使人工智能领域蓬勃发展,特别是在计算机视觉领域,将计算机视觉中的几何和图像相结合,用来解决机器人环境感知问题,被证明是一种非常具有前景的解决方案。智能机器人需要理解周围场景中的几何和语义两方面的特性,才能与周围环境进行有意义的交互,同时也是使机器人在环境中进行有目的行动的前提条件。环境感知技术是机器人实现智能化的关键部分,机器人利用传感器来感知空间环境,同时能够理解环境中具体信息。传统的感知方法很难实现,然而深度学习技术的出现使得机器人理解环境信息成为可能。机器人通过同步定位与地图构建(Simultaneous Localization and Mapping,SLAM)技术能够很好地还原三维环境的几何空间,然而并不能理解环境中具体物体信息,并且无法判断物体之间的相互逻辑关系。因此本文提出的一种方法,将基于深度学习的实时目标检测技术应用到传统的SLAM算法中,生成带有语义信息的三维环境地图,并且该方法能够有效的生成实时的三维语义地图,从而实现对环境的感知,本文的主要研究内容包括:首先,系统的阐述了基于深度视觉的SLAM系统,包括深度相机模型、坐标系、深度相机参数、视觉SLAM基本组成框架,最后从数学的角度对SLAM过程进行了描述。其次,本文从数学的角度推导证明了神经网络的前向传播和反向传播算法,并阐述了卷积神经网络的基本组成。为了确保对环境感知信息的实时性,本文需要对SLAM系统中关键帧的RGB图进行实时标注,因此本文介绍了基于R-CNN系列的目标检测算法和基于回归预测的快速目标识别算法,对比后最终采用YOLOv3算法,并在办公室环境中进行了实验验证,验证该算法的准确性和实时性。最后,本文使用ORB-SLAM2算法对空间信息进行实时的三维重建,并对该算法进行了改进,融合了目标检测算法YOLOv3,使用YOLOv3对ORB-SLAM2中的关键帧进行语义标注,在ORB-SLAM2既有的三个线程上,另外开辟了一条线程,使用点云库(Point Cloud Library,PCL)处理了带标注的关键帧和其对应的点云,生成带有语义信息的三维语义地图,来实现对环境的感知,并且在TUM数据集上进行了验证,最终在机器人上对该算法的准确率和实时性进行了验证。
其他文献
农业物流体系的构建可以从基础层、主体层、功能层和目标层4个层次来考虑。当前,我国农业物流在这4个层次方面都取得了巨大进步,但也存在问题,应该按照农业物流体系构建的要
<正>在成本受到约束的情况下,做到"海量客群"和"优越体验"的双达成。一言以蔽之,在"海量客群""极低成本"与"优越体验"之间兼顾并取得平衡,是招行在零售金融3.0时代取得领先的
建立地物光谱数据库,运用先进的计算机技术来管理和分析各种典型地物的光谱数据信息,是提高遥感信息的分析处理水平并使其能得到高效、合理之应用的一个有效途径。本文从光谱数
<正>架子是练习武术的基本功夫,大凡初学武术者都要先从架子开始练起。俗话说,三年的架子,五年的捶(旧时学武功要先拉三年架子,再打五年对练的套子,后者俗称"打捶")。盘架子
<正>如果你是一个刚毕业的学生,忽然接到一家大型企业的面试通知书,欣喜之余,你是不是有点紧张?如果你是一家大型企业的员工,忽然被提拔到了经理的位置,让你负责一个大型项目
企业在内部审计工作中需要对内部审计运行状况有一个全面、准确的认识,但内部审计工作的量化分析一直是困扰企业的难题。文章以内部审计效率和内部审计效益为关键指标,设置11
利用电厂锅炉掺烧污泥,在全国已成燎原之势。$$ 之所以流行,一个最主要的原因是“便宜”。然而事实真的是这样吗?$$ 掺烧背后,隐藏着许多隐性问题,包括处理总成本、环保标
报纸
测量了1310 nm和1550 nm波长下单膜光纤弯曲半径变化引起的弯曲损耗,分析比较了2种不同波长光和弯曲半径对弯曲损耗的影响。测量结果表明,弯曲损耗系数会随着弯曲半径的增大而
目的了解北京地区大型医院肺炎住院患者抗菌药物的使用情况。方法利用北京市十所三级综合医院城镇职工基本医疗保险数据资料,选取2008-2012年间主要诊断为肺炎的住院病例作为
当前,我国房地产发展存在两大显著问题:其一,一线城市、区域中心城市房价过快上涨,房价过高;其二,部分三四线城市房地产库存过大。概括起来就是“有人没房住,有房没人住”。$$ 、
报纸