基于对比演示的机器人任务学习研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户：mabimabide

【摘要】

：

任务学习是机器人智能水平发展到一定程度后的一个必然要求。与单个的简单动作学习相比，融合在任务中的行为学习更有研究价值和现实意义，可以更全面地提升智能体的自主认知能力

【作者】

：

陈世佳

【机构】

：

中国科学技术大学

【出处】

：

中国科学技术大学

【发表日期】

：

2012年期

【关键词】

：

任务学习对比演示智能机器人认知推理计算机视觉增量学习

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

任务学习是机器人智能水平发展到一定程度后的一个必然要求。与单个的简单动作学习相比，融合在任务中的行为学习更有研究价值和现实意义，可以更全面地提升智能体的自主认知能力和适应能力，使得智能机器人能在部分领域中弥补人力的不足，有助于缓和人口老龄化等严重的社会问题。演示学习作为一种“所见即所得”的方式，让机器人通过近似于“人-人”的教授模式来学习任务知识，增强自身智能水平，比强化学习等方式更简单直观，因而逐渐成为近年来人工智能领域的一大研究热点，得到了更广泛的研究和应用，新的挑战也随之而来。　　针对当前演示学习扩展性不足的问题，本文以基于视觉的任务学习为例，重点研究了通用对比推理过程在演示学习中的应用，并设计了演示方案进行验证。　　主要研究工作和贡献如下：　　 1．阐述了演示学习基本理论和行为知识表示，介绍了机器人视觉相关技术应用，并在此基础上提出了观察模仿的演示学习框架。　　 2．提出了以深度信息为分割掩码的HSI颜色空间目标检测方法，对场景目标进行检测和识别，并结合金字塔L-K光流法进行跟踪预测。实验结果表明，本文的方法能满足场景中视觉处理的可靠性要求，且具有较好的实时性。　　 3．通过探讨对比思想在演示学习中应用的可行性，提出了基于对比认知的观察模仿学习方法，并阐述了其基本步骤；研究了动作共享原则下的状态表示和动作识别方法，并在示例视频数据中取得了很高的动作识别率，这一结果表明，概念层次的范例表示具有较强的抗干扰性和可扩展性。引入有向图的因果网络表示法，提出了特色的逆向推理方法，有效利用了正反例信息来获取任务决策和约束；最后引入增量学习理念，进一步对该学习方法的扩展能力进行了验证和讨论，两部分的仿真实验表明，本文方法在学习效率和扩展能力方面具备一定优势。　　 4．设计了实体机器人平台上的演示学习系统框架和任务方案，进行了两组具有对比性的示例演示，并利用对比学习获取任务决策和约束，最后在类似场景下成功进行了多组任务的演示验证，结果表明本文的对比学习方法是有效性的。　　一言以概之，本文的对比学习方法在观察模仿模式下取得了成功的验证，开启了演示学习领域新思路，可以扩展到更复杂场景或者其他任务学习过程中，给机器人任务学习提供了有价值的参考。

其他文献

基于聚类的图像分类和分割算法

随着信息科学和互联网技术的快速发展,人们可以容易地获取大量的图像信息。但由于图像数量很大,人工用肉眼来分析图像内容变得不现实。为了自动分析图像内容,必须采用基于计

学位

聚类算法图像分类视觉词汇稀疏编码谱聚类图像分割

RFS的多目标跟踪算法及其在外辐射源雷达中的应用

准确跟踪多个运动目标的轨迹是一项在多个领域中都不可或缺的关键技术。目标的非协作性导致目标数目及运动信息难以获取，传感器本身的系统噪声及监控区域内观测野值带来了观测

学位

多目标跟踪外辐射源雷达P-CBMeMBer滤波多站联合定位多普勒频率

基于高频读卡器的考勤系统的设计

目前，高等学校的教育教学工作越来越难。对于高校内部来说，学生是学校里最大群体，学生上课缺勤的人数众多，管理十分复杂。由于种种原因导致学生出勤情况的报告与统计工作难度极大

学位

考勤系统射频识别高频读写器高等学校

负熵最大化的FastICA心电消噪研究

心电信号是一种在临床医学和生物研究中得到重要应用的生理电信号。通过对心电数据的研究,可以了解心脏的生理特性,为心脏及心血管疾病的预防、诊断提供重要依据。人体心电信

学位

快速独立分量分析ECG负熵最大化消噪

非均匀环境下机载雷达STAP方法研究

空时自适应处理(STAP)技术通过二维滤波器能够有效地抑制杂波，改善机载相控阵雷达检测目标的性能。常规的STAP处理中需要采用与待检测单元独立同分布(I.I.D)的训练样本对杂噪

学位

空时自适应处理(STAP)非均匀直接数据域算法(DDD)多级维纳滤波器(MWF)空时自回归(STAR)

数字集群调度终端视频传输功能的研究与开发

数字集群系统是专门用于指挥调度和紧急通信的专用移动通信系统,调度员可以通过调度终端直接监视重要的通话组或者单个无线用户,与无线用户进行语音和数据通信,实现方便而快

学位

数字集群调度终端视频传输H.264

数字图像零水印算法研究

数字水印技术是一种在开放的网络环境下实现信息隐藏与跟踪的新型技术,其基本思想是在数字产品中嵌入能表明所有者身份的版权信息,以便达到版权保护与内容认证等目的。由于数

学位

数字图像水印零水印多功能水印边缘检测对数极坐标变换快速离散曲波变换

嵌入式家庭物联网网关系统设计

物联网是新一代信息技术的重要组成部分，是在互联网技术成熟到一定水平提出的新概念，广泛应用于各个领域。基于物联网的智能家居系统表现为利用信息传感设备，将与家居生活相关的

学位

物联网网关系统ARM9微处理器Linux软件

基于MCMC的多运动目标分割与跟踪方法研究

基于视频的目标分割与跟踪技术是计算视觉领域中的最主要研究方向之一,虽然研究人员已经提出了很多有效的目标跟踪方法,但是由于目标跟踪中存在复杂背景干扰、目标外观变化、

学位

MCMC粒子滤波自适应跟踪窗数据关联多目标跟踪

基于视角和类别流形的目标跟踪识别

自动目标跟踪识别(ATR)技术是军事和民用领域中的一项广泛而重要的技术。基于视角的目标识别所面临的重大难题是如何捕获不同目标在不同视角下的外形特征,同时在当前的许多目

学位

目标跟踪识别形态插值流形学习张量分析粒子滤波

基于对比演示的机器人任务学习研究

与本文相关的学术论文