基于内在动机的发育机器人路径规划的研究

来源 :华北理工大学 | 被引量 : 1次 | 上传用户:xiaoliang1978
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对强化学习,人工势场算法等在两轮机器人的躲避障碍物和最优路径规划任务中存在的算法速度慢,白板学习和维数灾难以及自主能力不高等问题,受仿生学内在动机启发,将内在动机机制分别与Q学习算法,人工势场算法以及分层强化学习算法相结合,来解决以上问题。主要研究如下:1)强化学习在应用到机器人避障和路径规划当中存在着效率差且自发育能力不足等问题,提出了一种基于内在动机的Q学习算法(IM-Q学习算法)。该算法是用内在动机机制替换Q学习算法中的奖励值,从而使机器人能像人类一样通过动机来对做出决策,使机器人能自主发育并很好地完成路径规划任务。2)针对IM-Q算法在路径规划中前期存在白板学习导致整体学习效率底下的问题,结合了人工势场法,提出了基于内在动机的引力场Q学习算法(IM-GF-Q)。该算法首先利用引力场对环境模拟,为算法提供先验知识,然后再用IM-Q学习算法进行训练,从而提高了机器人在未知环境中对环境的学习和整体路径规划的速度。3)在实际情况中,障碍物不都是静止的,大多数情况下都存在动态障碍物,增加了机器人实现任务的难度,为了进一步提升机器人避障和路径规划的能力,提出了基于内在动机的分层强化学习算法(IM-HRL)。该算法利用分层原理,将普通的强化学习算法进行分层,把环境信息和任务详细分到各层去,从而简化算法的结构和求解效率,使机器人在未知的动态复杂环境中的避障和路径规划一样能很好地实现。基于内在动机的学习算法,主要针对机器人路径规划和避障任务,实验证明所提算法有效地实现了机器人在未知环境中的最优路径规划,为今后机器人自主学习和路径规划提供了新颖的想法。图41幅;表3个;参53篇。
其他文献
近年来,网络通信的速率越来越快,视频通话越来越普及。这其实要得益于复杂通信算法的发展,而复杂的通信算法最终是要以集成电路的方式来实现。但是随着通信集成电路设计的复
目前大学生毕业论文主要使用MicrosoftWord进行编辑,而且指导教师会要求他们不断地进行修改(包括排版格式的修改),因此,撰写和排版比较麻烦。只有对MicrosoftWord编辑系统有
本文进行了川白芷药材的RP-HPLC指纹图谱研究,同时结合代谢预测技术与虚拟筛选方法以及药效学实验确定川白芷治疗偏头痛的活性成分,采用qPCR法检测活性成分中欧前胡素对偏头
备好一节高职心理健康教育课,教师不仅需要了解高职学生的心理特点,更重要的是明确自身的角色定位,在此教育理念基础上必然会产生体验式教学模式,而在体验式教学模式下进行丰
首先,从几何流和地平线模型出发,分析流积分及其扫描带内的边缘表达;其次,抑制离散二元小波基函数的不足,构建Bandelet变换的标准正交基;最后,对Bandelet变换在扫描带内的逼
教师职业适应性作为人类社会适应的重要组成部分,是新任特岗教师踏入工作岗位必经的过程,是个人与职业通过不断协调达到统一的结果。当前,农村小学新任特岗教师工作的特殊性及其工作环境的艰苦性在一定程度上影响着新任特岗教师的职业适应性水平与乡村教育的质量,从而制约“特岗教师”计划的实施。而新任特岗教师是农村教师群体的新生力量,他们的出现为农村基础教育注入新鲜的血液,为农村教育的发展贡献了强大的力量。为了提高
紧张的人地对峙及其带来的灾难性生态后果是生态文明话语凸显的存在论境域。然而,人地危机不过是人际危机的表象,社会利益分配不公及其导致的利益失衡和贫富悬殊乃是生态危机的
化学概念教学对于初中学生学习和掌握化学知识具有重要作用,是学生学好化学的基础,也是培养学生良好化学认知观的前提。初中化学教师要在充分重视化学概念的基础上,掌握认知
目的:探讨温中运脾汤治疗慢性非萎缩性胃炎脾胃虚寒证的临床疗效。方法:采用随机数字表将符合本研究纳入标准的60例患者分成对照组及观察组各30例,其中对照组采用奥美拉唑治疗,观察组则在此基础上加用温中运脾汤治疗。治疗结束后记录其观察指标:中医临床症状评分、中医证候疗效、胃镜及病理疗效、临床总疗效、安全性评估及随访3个月的远期疗效,通过比较其治疗前后的积分差异来评价温中运脾汤对慢性非萎缩性胃炎脾胃虚寒证
在"金税三期"下,税务部门加大对增值税专用发票管理的考核力度,物业服务企业作为增值税专用发票管理范围内,要及时了解、掌握增值税专用发票的相关的措施,做好税收筹划。本文