基于高斯混合模型的模仿学习算法的优化与评价

来源 :北京工业大学 | 被引量 : 2次 | 上传用户:Hmilts
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
使机器人做出与人类相似的智能行为是机器人领域的研究热点,这就要求机器人具有学习的能力。模仿是生物获得技能的一种学习方式,引入模仿学习机制能使机器人具备一定的智能能力。但由于模仿学习对示教信息依赖性较强,而示教信息存在偶然性,同时模仿学习算法中存在随机取值等问题,导致模仿学习的效果不稳定。同时,模仿学习的过程考量难以用单一的指标进行评价。因此,本文围绕机器人模仿学习算法的优化与模仿学习的方案决策展开研究。论文主要工作为:第一,单次示教下模仿学习算法优化:高斯混合模型(Gaussian Mixture Model,GMM)具有很强的行为编码再现能力,因此,GMM被广泛应用于机器人模仿学习的表征。针对传统方法中随机选取聚类初值导致的学习结果不稳定,表征参数分两步确定导致的学习效率偏低的问题。采用一种多中心聚类算法中的最大最小距离算法改进k-means算法,得到稳定的初始聚类中心,并基于贝叶斯信息准则通过遗传算法优化求解,同时获取GMM表征的四个重要参数。第二,多次示教下多约束模仿学习优化算法的构建与实现:模仿学习对示教数据依赖性较强,传统的单次示教过程中的失误会增加模仿学习的难度,严重时导致失败。针对这一问题,提出了一种基于多次示教的多约束模仿学习优化算法,将表征后的概率区间作为约束条件,求解多约束条件的交集,降低了示教数据中劣质数据的表达概率,避免了由劣质数据造成的再现轨迹的波动。同时,引入了层次分析法,构建模仿学习评价模型,解决了定量评价模仿学习效果的问题。第三,基于集对分析的多约束模仿学习方案决策:针对示教次数对多次示教下的多约束模仿学习效果影响较大这一问题,本文应用集对分析法从贝叶斯信息准则、计算时间、拟合优度等角度出发,构建了多约束模仿学习方案决策模型,该模型能同时考虑影响因素的同一性、对立性,得到了可信度较高的多约束模仿学习方案。统计实验结果,提出一种具有指导性的多约束模仿学习示教次数的决策规律。实验结果表明,本文所提优化算法和决策模型对基于高斯混合模型的模仿学习的学习精度与学习效率有较大的提高,有效避免了由示教中的误操作所导致的学习效果不佳或学习失败,使性能稳定,并且对于提升多次示教下的模仿学习效果具有一定的指导意义。
其他文献
近年来,互联网经济的高速发展引领了新一轮的市场经济革命,尤其是金融领域,其逐步发展的网上银行、网上支付等功能将传统银行业与新兴市场有机的结合在一起,形成了这个时代所
结合某型号旋风除尘器的结构参数,建立除尘效率数学模型。通过MATLAB进行最优化求解,利用计算流体力学方法对优化后的模型进行除尘效率验证。结果表明:当筒体直径为328.0mm、
现金作为流动性最强的资产,公司持有一定量的现金可以满足其交易性动机、预防性动机以及投机性动机的需要。从上世纪末以来,无论是在国外市场还是在国内市场上,许多公司都大
在土建工程施工的过程中,施工单位需要对深基坑工程的支护施工提高重视程度,保证支护施工技术能够满足深基坑工程质量的需求。因此,对土建深基坑工程的支护施工技术及管理进
为明确不同氮肥用量下各生育期水稻(Oryza sativa L.)叶片平均SPAD值与地上部分含氮量、氮积累量的相关关系,试验设置了不同氮肥梯度下随机区组栽培试验。结果表明,水稻叶片
在黏土原料中使用废硅石,不仅降低黏土砖烧成收缩变形和吸水率,提高强度,还可降低砖生产原料费用。
11月21日,交通运输部副部长高宏峰在四川省交通运输厅厅长高烽陪同下,从成都乘车经汶川、理县到鹧鸪山,沿途考察四川藏区高速公路建设情况。高宏峰指出,藏区高速公路建设不仅
急性肾功能衰竭(ARF)是内科常见急症.各种原因引起肾灌注不足、肾脏损害及肾排泄受阻均可致ARF.本文对我院收治的ARF患者219例的病因进行回顾性分析,并探讨近年来的病因变化
就主要对装配式建筑项目和以往建筑项目机电安装工程之间的差异进行了简单的阐述,并且根据装配式建筑机电安装项目中的施工工艺问题,提出了一系列装配式建筑机电安装项目的施
从生态系统服务价值的角度解读河长制推行目标,并构建常州市河长制推行成效评价体系。基于常州市2009—2017年相关数据,采用熵值法确定各指标权重,运用TOPSIS模型将指标值与