一种自适应模糊Actor-Critic学习

来源 :控制与决策 | 被引量 : 0次 | 上传用户:a287924625
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出一种基于模糊RBF网络的自适应模糊Actor—Critic学习.采用一个模糊RBF神经网络同时逼近Actor的动作函数和Critic的值函数,解决状态空间泛化中易出现的“维数灾”问题.模糊RBF网络能够根据环境状态和被控对象特性的变化进行网络结构和参数的自适应学习,使得网络结构更加紧凑,整个模糊Actor—Critic学习具有泛化性能好、控制结构简单和学习效率高的特点.MountainCar的仿真结果验证了所提方法的有效性.
其他文献
目的探讨施他宁联合大黄对急性重症胰腺炎的治疗效果.方法将48例急性重症胰腺炎患者随机分为三组;A组15例,为施他宁联合大黄治疗组;B组14例,为施他宁治疗组;C组19例,为大黄治
<正>构建全国统一市场从上个世纪90年代开始提出来,近年来,国务院也加强部署发展现代流通业建设法治化营商环境,构建全国统一大市场,但是全国统一大市场的形成可谓是路漫漫,
目的归纳总结美容术后不良重睑的类型及产生原因,探索矫正的方法。方法针对不良重睑的类型采用不同的修复方法。基本原则是松解粘连瘢痕,尽可能恢复原有的解剖结构,调整重睑线的
目的:探讨中药内外合治法治疗真菌性阴道炎的效果。方法:我院2012年1月至2013年6月共收治真菌性阴道炎120例,随机分为治疗组与对照组各60例。对照组采用达克宁栓治疗,治疗组采用
文如其人,在认识王绍增老师之前,我是先通过王老师的文章景仰、崇敬王老师的。2012年我从工作岗位上回到华南理工大学建筑学院,在袁晓梅老师门下攻读博士学位,并在袁老师的引
男,47岁,2012年11月28日初诊。
根据复合材料的“混和定律”从理论上分析了纤维增强复合材料的拉伸性能与纤维体积分数的关系,导出了纤维体积分数的理论取值范围。
大量流入的国外资本确实可能给美国带来灾难,但不是本次金融危机的直接元凶,而且也是本次金融危机的间接原因。布雷顿森林体系Ⅱ框架下以美元为中心的国际货币体系仍在发挥作