论文部分内容阅读
提出了一种在动态不确定环境下基于信度分配Sarsa强化学习算法的移动机器人路径规划方法。通过引入信度分配函数有效分配强化信号,来修正动作选择策略,提高了学习效率和速度,能够很好地解决动态不确定环境下特别是存在随机运动障碍物的环境下移动机器人路径规划问题。仿真实验说明该方法的有效性和可行性。