论文部分内容阅读
本文提出了基于模糊自适应评价(FLAC)的增强式学习(Reinforcement Learning)控制系统(FLAC/ASN),FLAC采用模糊规则表示学到的知识,因此可以有机地融入专家的经验。FLAC的学习方法国瞬时微分法(Temporal Difference)。作用选择网络(ASN)采用多导同网络。仿真结果表明(FLAC/ASN)具有很好的学习性能。