基于领域自适应学习的机器人多目标物体抓取识别算法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:heritage102
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
抓取操作作为机器人的一项基本技能,在推进机器人智能化道路上扮演着十分重要的角色。目前,面对非结构化环境,机器人抓取技术仍缺乏自主能动性和环境的适应能力,严重影响了机器人的推广应用。基于机器视觉的机器人抓取方法在环境感知、动态决策和行为控制方面表现出了突出优势,但训练性能优良的深度识别模型需要海量带有标注信息的样本数据,且运用带标签的数据训练的识别模型在迁移到真实环境的过程中会出现性能大幅度下降的现象。针对上述问题,本文开展了基于领域自适应学习的机器人多目标物体抓取识别技术方面的研究工作,通过研究多目标物体抓取识别算法实现复杂环境中各目标物体的抓取位姿识别,运用标签噪声鲁棒性回归损失、数据跨域对抗生成等技术研究领域自适应学习方法,降低异域数据的分布差异,提升抓取识别模型的跨域识别能力,进而实现机器人在复杂环境中快速准确的抓取操作。主要研究内容如下:(1)提出了基于注意力机制多级特征融合的多目标物体抓取识别算法,以克服传统抓取识别方法在非结构化环境中识别准确率低、泛化能力差的问题。首先利用深度学习技术构建了物体检测与抓取位姿测量网络模型,并通过设计联合推理策略将两功能模块有机融合,实现了物体检测与抓取位姿的网络参数共享,减少了模型的参数量,提升了抓取识别速度;其次提出了基于注意力机制的多级特征融合方法,充分利用多级网络特征,降低噪声干扰,提高了抓取识别准确率;最后在多目标物体抓取数据集上开展了算法的性能测试实验,结果显示,物体检测准确率为95.31%,抓取位姿识别准确率为87.10%,识别速度达31.42fps,证明了该算法能够快速准确地识别出复杂场景中各目标物体的类别及其抓取位姿。(2)研究了标签噪声鲁棒性的领域自适应学习算法,以充分利用无标注信息的目标域样本训练性能优良的深度学习识别模型。针对无标签的目标域数据,提出了伪标签设定方法及其可信度判定方法,并根据目标域样本伪标签的可信度,构建了标签噪声鲁棒性的回归损失函数,降低了错误标签对识别模型的负迁移效应。并且在公开的Office-Caltech与Office-31图像识别数据集上进行了算法的性能测试,结果显示,领域自适应学习算法相对基准算法在两数据集上的识别准确率分别提高了13%与7%以上,能够有效提升深度识别模型的跨域识别能力。(3)研究了跨域自适应的多目标物体抓取识别算法,以提高机器人智能抓取操作系统跨域应用时的鲁棒性。一方面建立了图像跨域生成机制,在保留图像中目标物体特征及其标签信息不变的情况下,利用生成对抗算法将源域图像生成具有目标域风格的伪目标域图像,从数据层面减小两异域数据的特征差异;另一方面构建域混淆网络模块并融入到多目标物体抓取识别模型中,从网络结构层面减小异域数据的特征差异。并结合标签噪声鲁棒性的领域自适应学习技术,同时利用带标签的伪目标域与无标签的目标域数据训练多目标物体抓取识别模型,进一步提升抓取识别模型的跨域识别能力。最后建立了三个背景完全不同的跨域抓取数据集,测试了算法的跨域抓取识别性能,结果表明,该算法相对非跨域抓取识别方法在跨域抓取识别任务中物体的抓取识别准确率均提高了40%以上,有效证明了所提算法的优越性。(4)搭建了基于视觉识别的机器人智能抓取操作系统平台,完成了相机单双目标定、机器人“手-眼”标定与机器人运动控制等相关工作;设计了机器人抓取策略,并开展了非结构化环境下的机器人多目标物体分拣、未知物体抓取和堆叠螺栓抓取等相关实验。实验结果表明,基于领域自适应学习的多目标物体抓取识别算法能够准确稳健的指导机器人在复杂环境下自主的完成各类目标物体的抓取分拣操作,且对跨域识别任务具有强鲁棒性;同时还证明了该抓取识别算法可推广到新类别物体的抓取应用场景中。鉴于上述成果,本文的研究工作可为进一步研究机器人智能抓取识别算法提供理论和实验依据。
其他文献
电磁超表面因其具有新颖的、自然界里不易观察到的电磁特性,成为光学和人工材料学科的热门研究课题之一。超表面的光学特性主要取决于其基本单元的光学共振,通过调节基本单元的几何特征及组分变化,可以表现出负折射率,完美吸收和增强的光学非线性等特性。在这些特性的驱动下,人们提出了很多新的应用,包括反常折射和透射,光束整形,传播波与表面波的转换以及全息应用等。因此,对基本单元光学特性的研究(如近场增强性质,相位
姿态确定系统提供航天器当前的姿态信息,是姿态控制的前提。星敏感器和陀螺作为航天器主要的姿态敏感器,在轨发生故障的概率均较高,发生故障后若不能及时诊断并隔离,则错误的姿态信息将被引入到系统闭环控制中,可能使得载荷不能正常工作,甚至导致航天器损毁。在工程应用中,受制于星载计算机的性能,算法的运算复杂性和运算时间均受到严格限制,因此研究诊断准确性高且易于星上实现的故障诊断方法具有重要意义。在此背景下,本
随着航天技术的发展,航天任务越来越复杂,相对导航是实现各项航天任务的基础,因此,为了保障各航天任务的顺利执行,对相对导航算法提出了更高的要求。相对导航的原理为通过构建系统状态的演化模型,利用一系列传感器观测,实现对系统真实状态的估计。理想系统的状态估计可通过Kalman滤波实现。然而,受限于对实际系统的理解、通信过程中外界条件的干扰及系统内部各物理条件的限制,导致系统往往会受到模型非线性、相关噪声
广场作为城市重要的公共空间,是城市居民进行室外休闲活动的主要场所,其环境品质对于提升城市空间活力具有重要意义。然而,由于缺乏对于环境品质,特别是物理环境的考虑,大多数城市广场的环境均存在一定问题;其中,受到气候条件及设计理念的影响,严寒城市广场的热声环境问题较为严峻且存在季节性差异。与此同时,虽然针对于广场热声环境质量或环境感知的研究均较为广泛,但关于广场客观环境质量与使用者主观感知评价的关联研究
润滑剂可以降低机械设备的能耗,延长机械设备的寿命。作为一种新型且性能优良的润滑剂,复合钛基润滑脂近年来逐渐引起学者的广泛关注。然而,对复合钛基润滑脂的研究还缺乏系统性;其合成机理的探索尚不够全面,其制备因素、性能和微观结构之间的规律研究尚未完善;在摩擦学改性的研究方面,多种减摩抗磨剂的最佳配比不够精确;复合钛基润滑脂在固体膜层上的应用较少,需要拓展。上述问题制约了复合钛基润滑脂的生产和应用,本文针
燃烧数值计算在发动机设计中扮演着重要作用,燃烧动力学机理能在很大程度上决定该数值计算过程能否准确掌控燃料的释热规律、流场的精细结构以及污染物的反应路径。但目前数值求解由大型燃烧机理组成的动力学系统仍然是个挑战。此外,基元反应速率系数的不确定性也会给燃烧数值计算带来更多挑战,即该不确定性会对燃料演化过程中的关键路径及活跃基元反应产生巨大影响。因此开发带有速率系数不确定性的简化方法(即全局简化方法)能
当前世界各国必须面对与日俱增的能源需求以及日益恶化的环境问题所带来的严峻挑战,作为化石能源最有希望的替代者之一,质子交换膜燃料电池(PEMFC)的发展近年来备受关注。目前,铂及铂基合金是PEMFC中研究较为广泛且具有商业化潜力的电催化剂,但其居高不下的成本制约了燃料电池技术的进一步普及与推广。因此,开发出高活性、高稳定性兼具低成本的新型电催化剂是实现燃料电池技术大规模应用的关键环节。本论文从铂基电
球面网壳拥有优美的造型和良好的受力性能,在体育场馆、歌剧院及会展中心等大型公共建筑中应用广泛,并往往是所在地区的地标性建筑,社会、经济地位重要。从建筑构成上来看,球面网壳主要包含结构主体构件及表面、内部附带着大量的屋面围护部件及悬挂设备,这些屋面围护系统及悬挂设备可能会显著影响主体结构的静力及动力性能。尽管国内外学者已针对球面网壳的静力与动力性能开展了细致的研究工作,理论成果丰硕,但在研究中普遍忽
图像编辑涵盖多种图像处理任务,通常包含在像素层面改变图像内容的操作。大多数基于深度神经网络的深度学习方法是确定性模型,其存在的问题是它们通常只能够处理一种确定的编辑强度,并且整个映射过程是不可控的。现实生活中的变化通常是不确定的。如人脸老化是一个渐进的过程,用户想要获得不同年龄的人脸图像(输出可控),而不仅是某个确定年龄的人脸图像。再如在图像去噪任务中,不同图像的噪声水平是不同的,用户希望网络能够
纳滤作为一种介于超滤和反渗透之间的膜分离过程,具有运行压力低、出水水质好和分离过程无相变等特点,在饮用水深度处理、苦咸水净化、工业废水回用和海水淡化方面应用广泛。但是在运行过程中,纳滤膜也存在一些问题,如运行通量较低、易污染和氯稳定性差等。采用高通量纳滤膜可以弥补纳滤膜产水量不足的缺陷,从而降低运行耗能,节约运行成本。增加预处理可以缓解纳滤膜污染和氯稳定性差的问题,但是也增加了处理流程,使运行成本