Q-学习及其在智能机器人局部路径规划中的应用研究

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:guocheng19896230801
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
强化学习一词来自于行为心理学,这门学科把行为学习看成反复试验的过程,从而把环境状态映射成相应的动作.在设计智能机器人过程中,如何来实现行为主义的思想、在与环境的交互中学习行为动作? 文中把机器人在未知环境中为躲避障碍所采取的动作看作一种行为,采用强化学习方法来实现智能机器人避碰行为学习.Q-学习算法是类似于动态规划的一种强化学习方法,文中在介绍了Q-学习的基本算法之后,提出了具有竞争思想和自组织机制的Q-学习神经网络学习算法;然后研究了该算法在智能机器人局部路径规划中的应用,在文中的最后给出了详细的仿真结果 The term reinforcement learning comes from behavioral psychology, which considers behavioral learning as a process of trial and error, mapping the state of the environment into action. In the process of designing intelligent robots, how to realize the idea of ​​behaviorism and learn to act in the interaction with the environment? In this paper, the action taken by robots to avoid obstacles in an unknown environment is taken as a kind of behavior, and the reinforcement learning method is adopted to realize intelligent robot avoidance behavior learning. Q-learning algorithm is a kind of reinforcement learning method which is similar to dynamic programming. After introducing the basic Q-learning algorithm, a Q-learning neural network learning algorithm with competitive ideas and self-organizing mechanism is proposed. Then, The application of the algorithm in the local path planning of intelligent robots gives the detailed simulation results
其他文献
目的:检测心肌梗死大鼠梗死灶边缘区微血管密度(MVD)、缺氧诱导因子-1α(HIF-1α)和血管内皮生长因子(VEGF)表达情况,探讨顺气补心十一味丸对心肌梗死后缺血心肌血管生成的作用
为了深入分析嫩江地区粮食大幅度波动的原因,以便为全区农业生产的长远建设和远景规划提供基础资料和科学依据,我们对全区十一个县进行了235年次的大田作物产量和主要气象因
“十三五”时期是贯彻落实中央“四个全面”战略布局、加快“四个交通”发展、推进交通运输现代化的重要时期,交通运输发展战略机遇期内涵正在发生深刻变化.《国家公路网规划
期刊
近年来,重庆市大足区雍溪镇紧抓农村公路建设的有利时机,在慈云村公路修建过程中探索推广了村级重点项目“九步监督法”“梯次集资法”和“一事一议”,促使各个环节更加规范
期刊
目的: 研究AKT、p-AKT、AKT2及VEGF-C在乳腺浸润性导管癌中的表达及其在乳腺浸润性导管癌淋巴结转移中的作用;通过分析AKT、p-AKT及AKT2与VEGF-C的相关性,初步探讨AKT、p-AK
从开村位于贵州省黔东南州从江县加榜乡东北部,距乡驻地9公里.全村幅员面积8.8平方公里,海拔950米.辖从开寨、从稳寨、从九寨、秦家寨4个自然寨,共有167户659人,全部为苗族.
期刊
疫情尚未完全消退,汛期已然提前到来.今夏的公路应急抢险救灾前线,注定是一场艰难的保卫战.风雨中,我们将镜头对准防汛战斗中的公路勇士们,记录了那些触人心弦的点点滴滴.
期刊
The use of data driven models has been shown to be useful for simulating complex engineering processes,when the only information available consists of the data
随着新冠疫情防控取得阶段性胜利,全国经贸活动复苏进入快车道,7月,上海线下展会顺利重启.慕尼黑展览三大展会在浦江两岸联袂上演,现场观众络绎不绝,行业热情逐步释放.
期刊
目的:  采用腹部的连续横、矢和冠状断层标本,并结合健康志愿者腹部CT、MRI连续断层图像以及子宫内膜癌患者的影像、病理资料,研究腹主动脉旁淋巴结分布和淋巴引流的断层影像