基于对比演示的机器人任务学习研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:mabimabide
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
任务学习是机器人智能水平发展到一定程度后的一个必然要求。与单个的简单动作学习相比,融合在任务中的行为学习更有研究价值和现实意义,可以更全面地提升智能体的自主认知能力和适应能力,使得智能机器人能在部分领域中弥补人力的不足,有助于缓和人口老龄化等严重的社会问题。演示学习作为一种“所见即所得”的方式,让机器人通过近似于“人-人”的教授模式来学习任务知识,增强自身智能水平,比强化学习等方式更简单直观,因而逐渐成为近年来人工智能领域的一大研究热点,得到了更广泛的研究和应用,新的挑战也随之而来。   针对当前演示学习扩展性不足的问题,本文以基于视觉的任务学习为例,重点研究了通用对比推理过程在演示学习中的应用,并设计了演示方案进行验证。   主要研究工作和贡献如下:   1.阐述了演示学习基本理论和行为知识表示,介绍了机器人视觉相关技术应用,并在此基础上提出了观察模仿的演示学习框架。   2.提出了以深度信息为分割掩码的HSI颜色空间目标检测方法,对场景目标进行检测和识别,并结合金字塔L-K光流法进行跟踪预测。实验结果表明,本文的方法能满足场景中视觉处理的可靠性要求,且具有较好的实时性。   3.通过探讨对比思想在演示学习中应用的可行性,提出了基于对比认知的观察模仿学习方法,并阐述了其基本步骤;研究了动作共享原则下的状态表示和动作识别方法,并在示例视频数据中取得了很高的动作识别率,这一结果表明,概念层次的范例表示具有较强的抗干扰性和可扩展性。引入有向图的因果网络表示法,提出了特色的逆向推理方法,有效利用了正反例信息来获取任务决策和约束;最后引入增量学习理念,进一步对该学习方法的扩展能力进行了验证和讨论,两部分的仿真实验表明,本文方法在学习效率和扩展能力方面具备一定优势。   4.设计了实体机器人平台上的演示学习系统框架和任务方案,进行了两组具有对比性的示例演示,并利用对比学习获取任务决策和约束,最后在类似场景下成功进行了多组任务的演示验证,结果表明本文的对比学习方法是有效性的。   一言以概之,本文的对比学习方法在观察模仿模式下取得了成功的验证,开启了演示学习领域新思路,可以扩展到更复杂场景或者其他任务学习过程中,给机器人任务学习提供了有价值的参考。
其他文献
随着信息科学和互联网技术的快速发展,人们可以容易地获取大量的图像信息。但由于图像数量很大,人工用肉眼来分析图像内容变得不现实。为了自动分析图像内容,必须采用基于计
准确跟踪多个运动目标的轨迹是一项在多个领域中都不可或缺的关键技术。目标的非协作性导致目标数目及运动信息难以获取,传感器本身的系统噪声及监控区域内观测野值带来了观测
目前,高等学校的教育教学工作越来越难。对于高校内部来说,学生是学校里最大群体,学生上课缺勤的人数众多,管理十分复杂。由于种种原因导致学生出勤情况的报告与统计工作难度极大
心电信号是一种在临床医学和生物研究中得到重要应用的生理电信号。通过对心电数据的研究,可以了解心脏的生理特性,为心脏及心血管疾病的预防、诊断提供重要依据。人体心电信
空时自适应处理(STAP)技术通过二维滤波器能够有效地抑制杂波,改善机载相控阵雷达检测目标的性能。常规的STAP处理中需要采用与待检测单元独立同分布(I.I.D)的训练样本对杂噪
数字集群系统是专门用于指挥调度和紧急通信的专用移动通信系统,调度员可以通过调度终端直接监视重要的通话组或者单个无线用户,与无线用户进行语音和数据通信,实现方便而快
数字水印技术是一种在开放的网络环境下实现信息隐藏与跟踪的新型技术,其基本思想是在数字产品中嵌入能表明所有者身份的版权信息,以便达到版权保护与内容认证等目的。由于数
物联网是新一代信息技术的重要组成部分,是在互联网技术成熟到一定水平提出的新概念,广泛应用于各个领域。基于物联网的智能家居系统表现为利用信息传感设备,将与家居生活相关的
基于视频的目标分割与跟踪技术是计算视觉领域中的最主要研究方向之一,虽然研究人员已经提出了很多有效的目标跟踪方法,但是由于目标跟踪中存在复杂背景干扰、目标外观变化、
自动目标跟踪识别(ATR)技术是军事和民用领域中的一项广泛而重要的技术。基于视角的目标识别所面临的重大难题是如何捕获不同目标在不同视角下的外形特征,同时在当前的许多目