基于概率轨迹匹配的机器人模仿学习研究与实现

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:q19070
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
模仿是人类和动物获得知识和技能的一种重要的学习方式,因此机器人模仿学习的研究是机器人仿生机制研究的一个重要的方面,即机器人通过模仿学习获得新的知识和技能。针对目前模仿学习研究中示教轨迹及示教目的难以获取的问题,本文主要围绕基于轨迹模仿的机器人模仿学习展开研究,具体研究内容如下:  第一,在详细分析生物模仿学习的结构和机理特性的基础上,给出了具有仿生机制的机器人模仿学习的流程,搭建仿生机器人模仿学习的框架,定义了机器人模仿学习的数学模型,基于数学模型,完成了模仿学习各组成部分的表达。  第二,基于高斯过程模型的轨迹表达:针对示教过程中,需要从采集的离散状态数据获取示教轨迹的问题,基于高斯过程模型能够从已有的数据中,通过潜在的函数映射推断得到后验数据分布的特点,运用高斯过程实现示教轨迹的表达,以及含有未知策略的模仿轨迹的表达,仿真实验研究结果验证了方法的有效性。  第三,基于高斯混合模型的优化示教轨迹获取以及示教目的推断:针对示教目的无法获取和示教轨迹有效性问题,基于高斯混合模型(GMM)具有将时间域映射到空间域的特点,提出一种基于GMM和高斯混合回归(GMR)的示教轨迹优化方法。运用基于k均值法和EM算法参数估计的GMM对示教轨迹进行优化,提升优质轨迹权重并剔除劣质轨迹干扰;基于概率密度分析,运用GMR对示教轨迹进行多次迭代逐步缩小目标状态的轨迹范围,进而推测得到示教目的。以机械臂示教轨迹为研究对象进行仿真实验研究,结果验证了基于高斯混合模型的示教轨迹优化算法有效解决了示教目的无法获取和示教轨迹有效性问题。  第四,基于概率轨迹匹配的机器人模仿学习策略研究与实现:针对模仿学习策略复杂且难以获取的问题,采用RBF神经网络表达模仿学习策略,引入概率模型KL散度作为代价函数,将含有RBF策略的模仿轨迹与已优化的示教轨迹在KL散度条件下进行匹配,从而获得最优模仿学习策略,将其应用于关节型机器人的机械臂摆动模仿学习任务中,进行仿真实验研究。结果表明,基于概率轨迹匹配的机器人模仿学习方法能够实现机器人动作模仿,在处理机械臂摆动等非线性运动过程时较简易,学习速率较快,学习效果也较其他部分方法良好。  本文研究成果在提高模仿学习系统的通用性和示教轨迹优化等方面具有积极意义,对于机器人轨迹模仿的模仿学习任务具有一定的应用价值。
其他文献
随着装备制造业信息化程度的不断提高,数控机床在机加工生产线中的应用愈加广泛,要实现机加工生产线的低成本信息化管理,实时掌控生产线中各类数控机床的运行状态及加工数据就显
污水处理过程是一个集物理沉降、化学反应、生物降解为一体的复杂工业过程,容易受到进水水质、水量以及污泥负荷等扰动因素的影响,从过程控制的角度来看,污水处理过程具有多扰动
DNA技术的发展,给肿瘤疾病患者带来了福音,但是产生的基因表达谱数据规模日趋庞大,已经超出人们的认知范畴。人们获得的肿瘤基因表达数据大部分具备“高维小样本”的性质,如何从
该文从方法、软件和应用几个方面对复杂系统辨识进行了一些探讨,主要内容为:1.几类复杂系统的辨识方法研究.(1)针对噪信比高的线性系统,提出了一种基于多分辨分析和正交基展
随着机器人应用范围的日益扩大,其面临的环境也越来越恶劣,这对机器人的地形适应能力和自主运动能力提出了更高的要求。蝗虫的跳跃具有速度快、距离长、能耗少、对地面环境要
该文概述了异构数据库转换管理系统(HDBCMS)的理论基础和实现技术,提出了系统体系结构的实现方案;详细地阐述了作为HDBCMS重要组成部分的基于不同数据库系统(ORACLE、SYBASE
该文针对张力控制系统,设计了这三种方案,在线计算量大大减少,并讨论了误差在线补偿系数的关键作用.该文还对这三种方案进行了比较,分析了各自的特点和适用范围,提出了对意外
当前有关行机群系统的各项研究中,以NASA的Beowrlf项目的应用得最广泛.该文主要介绍了Bewrlf机群系统PCC-32的研制与性能测试过程.文章首先从分析简单机群系统软件硬件结构开
随着社会的发展与科技的进步,人们对机器人技术的要求已经不再是仅仅满足于简单的重复工作,而是提出了更多智能化的要求。人类80%以上信息的获得来自视觉,因此,基于视觉的场景识别
该文介绍了国内外电动汽车的发展现状和交流电机调速系统的发展过程;从电机数学模型的坐标变换,推导出便于仿真的数学模型;详细阐述了直接转矩控制的基本原理和直接转矩控制