一种用于Kick问题的模糊增强学习

来源 :2005中国控制与决策学术年会 | 被引量 : 0次 | 上传用户:asfdasdfasd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  机器人足球是一个标准问题,可用来评估多种理论、算法及结构的好坏.复杂任务下的行为学习是其中一个重要的研究领域.对此,提出一种模糊Q学习的增强学习方法,使智能体通过基于模糊规则系统的参照结果来决定其自身行动.将该方法用于机器人足球中的踢球问题,实验证明该方法是有效的.
其他文献
肺结核是一种严重危害人民群众身体健康的呼吸道传染病,为当前最紧迫的公共卫生问题和社会问题之一[1]。永嘉县自2005年始根据卫办疾控发〔2005〕24号文件精神,在原涂阳和重
期刊
  针对在利用区域温热灌注疗法治疗肿瘤时,因人体是一个复杂的热传导系统,很难建立精确数学模型的问题,并根据模糊控制不需要精确的数学模型,且对参数的变化不敏感的特点,
  建立了一种新的免疫agent多识别器模型,在该模型中每一个agent识别器就是一个免疫RBF神经网络模型,免疫RBF神经网络模型中输入数据作为抗原,抗体为抗原的压缩聚类映射作
会议
  针对一类T-S型模糊模型,给出一种设计镇定控制器的方法.该方法所依赖的稳定性假定只涉及其中一个特定的模糊子系统的选取,而模糊规则库中的隶属函数可以依照一个数学导引
目的全面评估成都市各级卫生监督机构能力建设的现状,发现问题,找出薄弱环节,为改进和强化机构能力建设提供科学依据。方法选取与成都市经济发展水平较为接近的副省级城市卫
  针对具有非线性、大时滞、强耦合以及不确定因素的复杂系统,采用了一种小脑模型关节控制器(CMAC)的逆模型智能控制策略.与传统的控制方法不同,该方案通过逆模型反映系统
会议
目的 总结实验室四年质量管理体系内部审核结果的变化趋势,为改进质量管理体系创造机会和条件.方法 选择2006-2009年的内审报告,运用统计学方法分析其不符合项数据及分布,分
  提出了一种基于遗传算法的自适应入侵检测系统体系结构,将遗传算法用于自适应入侵检测系统中.另外采用了智能体技术,解决了传统的集中式入侵检测系统的弊病,将任务处理和
会议
  利用模糊T-S模型对一类非线性时滞系统进行建模,提出一种新的在线参数估计方法,设计自适应率的估计器用于调整参数,井根据李雅瞢诺夫函数方法综合分析.使得估计模型能够
目的通过现状调查及疾控机构应急能力的定量评价,对其应急能力进行缺陷诊断,识别出其应急管理工作中较为满意和需要改进之处,并提出规划和整改政策建议。方法通过现场问卷调