机器人移动操作中的视觉认知技术研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:tujiangbo110
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能时代的到来,机器人越来越广泛的应用于各行各业,在室内建筑工地场景下,机器人能够节省大量劳动力和大量时间。视觉能够为机器人提供大量信息,本文旨在模仿人类视觉认知机制,为机器人赋予目标检测及定位的视觉认知能力。传统基于双目视觉的深度相机对环境光照非常敏感,在光照较强和较暗的情况下双目视觉算法效果会急剧下降,同时在单调缺乏纹理、缺乏视觉特征的场景下,双目视觉算法还会出现特征匹配困难的情况。此外,基于飞行时间法的深度相机,由于技术不成熟,存在功耗较大、成本较高以及深度图像分辨率较低的问题。所以本文采用双目结构光相机来完成定位功能。近年来,深度学习在计算机视觉领域有了飞速发展,单任务的网络结构已经逐渐不再引人瞩目,取而代之的是集成、复杂的多任务网络模型,其中的代表就是实例分割模型。实例分割是一个比较综合的问题,它融合了目标检测、图像分割以及目标分类,并且检测性能也是领域中的佼佼者。因此,为了使机器人更好更快地识别物体并判断物体的位置,本文提出一种室内基于Mask R-CNN模型和双目结构光相机的目标检测和定位方法。本文的主要研究工作内容如下:1.研究并实现Mask R-CNN模型,同时对模型性能进行优化。具体方式是通过调整Mask R-CNN模型的训练方式,其一是忽略训练集中提供的目标框,改为采用自己生成目标框的方式,选择包含目标物体所有像素的最小框作为边界框;其二是采用梯度裁剪的方式,来防止梯度爆炸。从而使得Mask R-CNN模型效果得到提升,至此,使用Mask R-CNN模型完成了对图像精确的目标检测以及像素级分割。2.研究深度相机测距技术,并结合深度学习对测距效果进行提升。目前采用深度相机对物体进行测距的主流方式是对整个目标框中的每个像素的深度值求平均,但是目标框中并不是每个像素都属于目标物体,所以这种方式必然会带来误差。而本文通过Mask R-CNN模型对目标框中的物体进行像素级分割,可以过滤掉大部分不属于目标的像素,从而提升测距效果。至此,使用Mask R-CNN模型结合双目结构光相机完成了目标检测和定位功能。3.最后根据目标检测及定位结果,使用丹麦Ur公司下的Ur10机械臂来进行目标捕获实验,最终通过实验证明,本文提出的室内基于Mask R-CNN模型和双目结构光相机的目标检测和定位方法的有效性。
其他文献
行列式作为高等代数的一个基本概念,它的计算是高等代数中的难点、重点,行列式的计算方法多种多样,特别是高阶行列式的计算,学生在学习过程中,普遍存在很多困难,难于掌握.行
<正>在我琐碎庞杂的童年记忆里,阿尾和阿尾仔是两个频繁出现的名字,但这两个相似的名字,其实并不是同一个人,阿尾是五哥金峰的乳名。那时候,不讲计划生育,家家都有一堆孩子,
目的肾上腺疾病是内分泌系统比较常见的病变。肾上腺皮质疾病因起源不同而表现出不同的临床症状与体征。功能性肾上腺皮质疾病中,球状带疾病常表现原发性醛固酮增多症,束状带疾
为了找出荒漠区土壤地物光谱特征变异的规律及其与植被覆盖度变化之间的对应关系,以石羊河流域下游荒漠化典型地区民勤县为研究区,用SVCHR768光谱仪对流沙地、砾质戈壁和土质
为增强开放教育在非学术支持服务的服务能力,提升开放教育的办学实力,在充分阐述开放教育非学术支持服务内涵的基础上,以佛山开放大学机器人服务平台,微信公众号智能服务平台
<正>综合行政执法体制改革历来是社会和企业群众高度关注的热点问题。2016年,五莲县组建综合行政执法局,成立综合行政执法大队,推进跨领域跨部门综合行政执法,集中行使行政处
<正>探索群落构建机制的生态和进化过程是群落生态学领域的一大中心任务.在局部森林群落水平上,运用系统发育分析方法探讨群落构建规则是群落生态学的研究热点.中国科学院华
背景:宫颈癌是最常见的妇科恶性肿瘤,临床上主要应用手术、放疗和化疗等相结合的综合治疗手段,但药物所带来的严重毒副作用迫使我们进一步探索低毒高效的宫颈癌治疗方案。目
目的:研究MAGE、BAGE、GAGE基因在宫颈癌组织、正常宫颈组织及宫颈癌细胞株Hela细胞中的表达情况,探讨肿瘤特异性抗原MAGE、BAGE、GAGE作为子宫颈癌免疫治疗特异性靶位的可能性
为客观地反映既有路基的承载能力状况,基于结构动力学基本理论,建立了沥青路面结构的动力有限元数值分析模型,分析了路基模量参数与路表动态弯沉盆参数指标的相关关系,据此构