论文部分内容阅读
本文对基于模糊ART和Q学习的路径规划进行了探讨。Q学习是一种强化学习方法,它实现从状态空间到有限的动作集合的映射,并通过环境给出的强化信号对网络进行学习。由于强化信号要求的环境状态是有限的、离散的,所以引入模糊ART网络对状态空间进行划分。结合传统的人工势场法,避免了局部极值问题,可以实现增量学习,适用于环境存在突变和动态障碍物的情况。