基于模仿学习和隐马尔可夫模型的人机交互研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:gordontang530
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年来随着机器人产业的发展,越来越多的机器人从实验室和工厂中走入人们的生活中。人与机器人越来越多的接触对机器人提出了新的要求。机器人需要有足够的适应能力适应变化的环境。此外,机器人的动作还需要能模仿人类的动作,让这些动作从人类的角度看起来自然而舒适。过去的机器人需要针对它们需要执行的每一个任务进行繁复的人工编程,即使在今天,绝大多数机器人仍是这么做的。但对需要在日常生活中与没有专业知识的用户进行交互的机器人来说,人们很难想象如何提前考虑好机器人在生活中所可能面对的所有任务,并针对这些任务编写好程序。这要求机器人能够通过一个简单直观的方式学习新任务所要求的动作,并且要求所学会的动作具有鲁棒性与适应性。本文针对人机交互中存在的上述问题基于模仿学习与隐马尔可夫模型展开了研究。  本文基于隐马尔可夫模型对人手的动作序列进行建模,从而识别人类意图。本文提出了一种简洁有效的人手动作序列识别算法,采用三维角度编码方式,对人手位置进行编码。然后利用 Baum-Welch算法结合前向后向算法从编码数据中学习模型参数。此外本文引入阈值模型来区分已定义动作和未定义动作。当用户做出动作时,本文利用前向后向算法,迭代计算在各个模型参数下出现当前观测的概率。  传统的基于模仿学习的人机交互问题的研究大部分都是基于DMPs(Dynamic Motor Primitives)方法所做的,DMPs方法虽然能够在机器人具有高自由度的时候保持较高效率。但DMPs方法无法应对时间上的扰动,并且不能将多条演示轨迹整合到一个动力学系统中。本文假设人类会根据交互距离的不同采取不一样的交互动作。基于这个假设,本文对机器人和人类在日常场景中的交互进行了研究。针对DMPs方法所存在的问题,笔者引入了SEDS方法来基于演示学习轨迹。SEDS方法基于高斯混合模型设计了一个非线性动力学系统,在满足所要求约束的前提下,这个动力学模型在目标点上是全局渐进稳定的。其中高斯混合模型的参数可以基于演示轨迹利用非线性最优化方法结合EM算法获得。  为了验证本文提出的方法的可行性,本文模拟人和机器人的日常接触设计了实验,要求机器人和人类完成击掌和握手两个动作的交互。本文基于MATLAB仿真的结果选择了最合适的K值和目标函数,并从理论上解释了为什么要选择这个目标函数。实验效果验证了本文提出方法的有效性。本文所获得的成果可以被应用在服务机器人与人类的交互上,也可以用在工厂中让机器人给人类传递工具。
其他文献
随着科学技术的飞速发展,机械臂已在多种领域普遍应用,对其运行的精确性和安全性提出了更高的要求。机械臂控制方式灵活,有较强的适应工作环境的能力,但它是一类复杂非线性系
随着计算机技术的高速发展,制造业正在向自动化、智能化与机器人化发展。本文以自动识别焊缝中心为目标,提出了焊缝图像处理算法,并建立了基于DSP的焊缝图像处理系统。焊缝图
三轴仿真转台作为半实物仿真的关键设备,三个自由度分别模拟飞行器在飞行中的三个姿态,其性能的好坏直接决定被测系统或被测元件的研制周期及最终的性能优劣。随着国防科技的
台风是严重影响人类社会生产和生活的灾害性天气,对于多普勒天气雷达反射率图像中的台风云系进行准确分割,同时对其中心进行准确定位,具有极其重要的现实意义;本文提出的一系列方
汽车在紧急制动过程中易出现车轮抱死和拖滑等非稳定因素,从而导致很多的交通事故。汽车防抱死制动系统ABS(Anti-lock Braking System)是在传统制动系统的基础上采用电子控制
并联机器人是现代工业中重要的一类机器人。其中,Delta并联机器人是最典型的空间三平移自由度的并联机器人,它的总体结构紧凑、简单,驱动部分均匀分布于固定平台,这些特点使
视觉跟踪技术是机器视觉领域的一个重要分支,在视频监控、视觉导航、医疗等领域有着广泛的发展前景。随着传感设备及计算机硬件性能的提升,视觉跟踪更是显示出了其广阔的用武
定位导航以及动态避障是体现移动机器人智能水平的一项关键技术,受到了国内外学者的广泛关注。本文在研究室“室内保沽机器人”项目的资助下,以该机器人系统的实现为研究目标,围
学位
针对工业生产中普遍存在的且难于控制的时滞多变量耦合的多输入多输出被控过程,尤其是时滞多变量非方系统这样的被控过程,本文在深入研究了被控过程控制相关领域的历史、现状
时间序列中普遍存在着周期性的行为,从时间序列数据库中提取出周期性规则,即周期模式挖掘在时间序列数据挖掘中具有很重要的地位,异步周期模式挖掘作为时间序列周期模式挖掘