改进的模糊Q学习方法及其在RoboCup中的应用

来源 :计算机仿真 | 被引量 : 9次 | 上传用户:kingerfly
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了在multi-agent系统中实现agent之间的竞争与协作,该文提出了一种新的在线学习方法,即:改进的模糊Q学习方法,在这种方法中,agent通过增强学习方法来调节模糊推理系统,进而获得最优的模糊规则。为了改善学习的时间,Q学习方法中的奖励值并不是固定的,而是根据状态而变化。将改进的模糊Q学习方法应用到RoboCup仿真环境中,使智能体通过在线学习获得跑位技巧。并通过实验证明了该方法的有效性。
其他文献
随着社会的进步,法制建设的不断完善,全民法律意识的不断加强,病人的自我保护意识日益增强,加上医院改革的不断深入及医疗水平的不断提高,病人卫生健康知识和就医需求的增长,医疗纠
目的 本研究主要就精神科患者采用丙戊酸纳进行治疗的临床情况展开分析讨论,以此来为此类药物的临床应用价值展开分析探讨.方法 对近年来有关丙戊酸纳对精神科患者在临床治疗
针对一般基于案例属性相似度的案例检索方法在实际应用时存在相似性度量的定义等难点而无法保证高效、准确检索的问题,提出了一种新的案例检索方法.根据粗糙集理论对冷轧负荷
随着医疗体制改革的不断深入,医院档案管理工作迎来了新的发展机遇和挑战,对医院档案管理工作人员提出了更新更高的要求。档案工作者只有端正思想、加强学习、更新观念、提高自
目的:探讨支气管哮喘合并肺部感染的临床治疗方法及其效果。方法回顾性分析我院52例支气管哮喘合并肺部感染患者的临床资料,结合实验资料进行综合分析,25例为革兰氏阴性菌感染,20
目的:观察物理疗法及手法加玻璃酸纳治疗膝骨性关节炎的效果。方法给予超短波、半导体激光照射及手法治疗,加玻璃酸纳关节腔内注射,共治疗86例,98个膝关节,45天为一疗程。结果通过
目的 探讨瑞芬太尼在七氟醚快速诱导无肌松气管插管期间防止高血压反应发生的最佳的效应室浓度,为临床应用提供参考.方法 选取我院2011年7月至2012年4月期间行手术治疗的符合
婴幼儿早期发展综合干预是以现代科学育儿新理念为指导,致力于促进家庭、社区和全社会,改变传统育儿习惯的错误做法和不利影响,推动婴幼儿早期发展综合干预服务进社区、进家庭,为
分析了皮革工业在市场阐述了推动下的转变,从生产、经营、科研到人才培养的完整体系.分析我国的市场优势,所面临和要解决的一系列问题,品牌塑造的重要性.
在胶原的羟脯氨酸测定中,传统的酸法水解是在110℃下使用6 mol/L的HCl消解24 h,其操作步骤繁琐且所花时间较长.本文的目的在于通过对酸水解条件的优化,简化羟脯氨酸测定的操