基于机器学习的机器人路径规划方法研究

来源 :重庆理工大学 | 被引量 : 0次 | 上传用户:yinhuali
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着机器人在社会生活中的广泛应用,机器人技术也成为了当前研究的热门方向。而在控制机器人移动的研究领域中的三大核心是机器人的定位、任务的分配和路径规划技术。其中,路径规划是移动机器人到达任务目标、完成任务内容的首要条件,因此研究避障路径规划具有重大理论价值与应用前景。在本文中主要研究了机器学习方法在机器人系统的路径规划中的应用,具体研究内容如下:(1)研究总结了机器人路径规划问题的相关技术方法以及研究现状,给出了在单机器人路径规划中使用强化学习方法具有的优点以及缺陷,以及在多机器人路径规划中使用单一算法存在不足。提出了多机器人系统更适合结合多种避障方法来解决问题。(2)对Q-Learning算法应用于单机器人路径规划时存在三点缺陷,逐一进行了改进:针对探索和利用的平衡问题,提出一种动态改变?的?-greedy策略。该策略依据算法学习的效果来决定是探索环境还是利用环境,使算法更加智能。针对最大化偏差问题,提出一种基于概率的动作选择策略。舍弃最大化的方法,使Q值较大的动作被选择概率更大,而不是一定被选择。从而解决了相关噪声对于算法准确度的影响,使算法更加合理。针对更新速度慢的问题,提出在算法中增加一个计数阈值,当试错次数达到计数阈值后,才进行修正,提高了算法的效率。基于上述的改进,提出了一种基于改进的Q-Learning算法的单机器人路径规划方法,并且进行了仿真实验。结果表明,该算法与改进前相比,训练时长更少,算法效率更高,并且能够解决复杂环境下的单机器人路径规划问题。(3)对DQN算法应用于多机器人系统的路径规划时存在的两点缺陷,逐一进行了改进:针对收敛速度慢的问题,提出在学习之前利用先验知识对Q值表进行初始化,减少了学习的复杂度和计算的繁琐度。针对随机性大的问题,提出增加先验规则来控制机器人在路径规划中的动作选择,能够减少无用的探索,提高算法的效率。基于上述改进,提出了一种基于先验知识与DQN的多机器人路径规划方法,并且进行了仿真实验。结果表明,该算法在多机器人路径规划中是可行的,与改进前相比,算法的收敛时间得到了减少,提高了算法的效率。
其他文献
随着我国改革开放的不断深入,中国的经济进入了一个新的时代。加之我国已加入WTO,有必要研究外资企业的财务管理以及它们在中国的实践,取其精华和吸收其先进做法,对我国企业
21世纪是知识竞争的时代,承载知识的人是企业核心竞争力的重要来源,因而成为企业争夺的关键资源。在动态复杂的市场环境下,企业人力资源规划不再局限于传统的需求和供给分析,如何
目的了解泉州市2010—2014年男男性行为(MSM)人群HIV感染情况及危险因素,为制定防控措施提供依据。方法对"滚雪球"方式招募的MSM者开展问卷调查,并采集血清进行HIV和BED检测,
随着科学信息技术的跨跃式发展,世界性的知识经济时代已经到来,而企业的经营与管理也正在随之发生明显的变化。二十一世纪的企业经营管理已不再是原有的功能性管理,而逐渐转变为
响水涧抽水蓄能电站上水库主坝为面板堆石坝,垫层料的细粒含量相对较高,在垫层料施工时采取加粉砂的方法增加细粒含量,施工中采用堆料和反铲铺料相结合的方式,利用斜坡碾进行
目的了解泉州市男男性行为(MSM)人群HIV、梅毒及丙肝感染率及影响因素现状和变化趋势,为制定防治策略提供依据。方法连续3年用"滚雪球"和"方便抽样"法招募到样本,对MSM人群进
科技型小微企业是科技创业的主体,它们不仅创造大量的税收和新的就业机会,而且在推动技术创新方面发挥了重要作用。在我国,能够渡过三年初创期的科技型小微企业不到三分之一。为
精神病人强制医疗是国家为了避免公共健康利益遭受损失,对患有精神疾病的人所采取的特殊约束方式,即在其不自愿接受治疗的情况下,经过法律规定或者相关机构和部门的批准,对其进行
第一部分4-羟基异亮氨酸对3T3-L1细胞的细胞毒性作用及对胰岛素抵抗状态的影响研究背景及目的:中药葫芦巴具有降糖降脂的功效,其有效性和安全性已被众多研究证实,因此被广泛应用
对行星天然卫星互掩互食天象进行测光可以得到非常准确的天体测量信息,这些信息可以用来进一步改进行卫星的运动理论和历表.对2003年在云南天文台1米望远镜上实际观测到的互