论文部分内容阅读
使机器人做出与人类相似的智能行为是机器人领域的研究热点,这就要求机器人具有学习的能力。模仿是生物获得技能的一种学习方式,引入模仿学习机制能使机器人具备一定的智能能力。但由于模仿学习对示教信息依赖性较强,而示教信息存在偶然性,同时模仿学习算法中存在随机取值等问题,导致模仿学习的效果不稳定。同时,模仿学习的过程考量难以用单一的指标进行评价。因此,本文围绕机器人模仿学习算法的优化与模仿学习的方案决策展开研究。论文主要工作为:第一,单次示教下模仿学习算法优化:高斯混合模型(Gaussian Mixture Model,GMM)具有很强的行为编码再现能力,因此,GMM被广泛应用于机器人模仿学习的表征。针对传统方法中随机选取聚类初值导致的学习结果不稳定,表征参数分两步确定导致的学习效率偏低的问题。采用一种多中心聚类算法中的最大最小距离算法改进k-means算法,得到稳定的初始聚类中心,并基于贝叶斯信息准则通过遗传算法优化求解,同时获取GMM表征的四个重要参数。第二,多次示教下多约束模仿学习优化算法的构建与实现:模仿学习对示教数据依赖性较强,传统的单次示教过程中的失误会增加模仿学习的难度,严重时导致失败。针对这一问题,提出了一种基于多次示教的多约束模仿学习优化算法,将表征后的概率区间作为约束条件,求解多约束条件的交集,降低了示教数据中劣质数据的表达概率,避免了由劣质数据造成的再现轨迹的波动。同时,引入了层次分析法,构建模仿学习评价模型,解决了定量评价模仿学习效果的问题。第三,基于集对分析的多约束模仿学习方案决策:针对示教次数对多次示教下的多约束模仿学习效果影响较大这一问题,本文应用集对分析法从贝叶斯信息准则、计算时间、拟合优度等角度出发,构建了多约束模仿学习方案决策模型,该模型能同时考虑影响因素的同一性、对立性,得到了可信度较高的多约束模仿学习方案。统计实验结果,提出一种具有指导性的多约束模仿学习示教次数的决策规律。实验结果表明,本文所提优化算法和决策模型对基于高斯混合模型的模仿学习的学习精度与学习效率有较大的提高,有效避免了由示教中的误操作所导致的学习效果不佳或学习失败,使性能稳定,并且对于提升多次示教下的模仿学习效果具有一定的指导意义。