基于内省推理的多agent在线学习新方法

来源 :2005年中国模糊逻辑与计算智能联合学术会议 | 被引量 : 0次 | 上传用户：yymmttjjjj

【摘要】

：

多agent环境下agent的最优策略取决于其他agent的策略,这使得学习目标不易被清晰的定义.基于客观观察行为建模的方法并不保证学习策略最终收敛.本文提出了基于内省推理方法的

【作者】

：

韩伟;王成道;陈优广;

【机构】

：

华东师范大学计算机系,上海,20062

【出处】

：

2005年中国模糊逻辑与计算智能联合学术会议

【发表日期】

：

2005年期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

多agent环境下agent的最优策略取决于其他agent的策略,这使得学习目标不易被清晰的定义.基于客观观察行为建模的方法并不保证学习策略最终收敛.本文提出了基于内省推理方法的多智能体环境下智能体高效在线学习方法,将基于对手模型的客观观察行为与基于换位思考推理的主观意图推测结合起来.仿真结果证实了算法在电子市场定价中的有效性.

其他文献

不规范使用管状吻合器导致吻合口梗阻(附40例报道)

目的探讨胃肠外科手术中不规范使用管状吻合器而导致吻合口梗阻发生的原因及预防对策.方法回顾性分析2005年7月至2016年7月期间于笔者所在医院接受胃肠道手术且在术中使用

期刊

模糊Lambek演算

本文意图将Lambek演算LC中的范畴概念推广到模糊模糊范畴,从而使LC推广为模糊Lambek演算FLC,并给出易于应用的简化演算FLC*.通过示例的成功应用,说明FLC是LC的一种合适的推广

会议

模糊范畴演算应用本文意图概念

我国劳动保护科研成果首次获世界发明金奖

本刊讯我国的一项劳动保护科研成果──由黑龙江省劳动保护研究所研制的GS系列隔声、阻尼、防辐射材料(见本刊11期报道),最近在第36届世界发明博览会上首次获得金奖。我国劳

期刊

科研成果防辐射材料

Ⅳ期结直肠癌转移病灶的局部根治性与姑息性处理进展

手术完全切除肝/肺转移灶仍是目前治愈结直肠癌肝/J|肺转移的最佳方法,推荐符合手术适应证的患者在适当的时机接受手术治疗初始不可切除的患者推荐经多学科团队讨论后,行全身

期刊

基于或-符合展开系数图的布尔差分计算

本文分析了逻辑函数在部分变量取反时的或-符合展开系数图(即dj图)和降维或-符合展开系数图(即降维dj图),在此基础上提出了用dj图和降维dj图计算逻辑函数的一阶布尔差分和二

会议

展开系数逻辑函数布尔差分图形方法直观计算基础合式变量

G(o)del语言中面向对象技术的实现

G(o)del语言是一种说明性逻辑程序设计语言.该语言基于一阶逻辑,支持抽象数据类型和模块化程序设计等技术,语言本身也具有很强的说明性语义.本文引入了在G(o)del语言中支持面

会议

逻辑程序设计语言面向对象的程序说明性语义面向对象技术抽象数据类型实现和应用语言成分一阶逻辑开发技术模块化

基于模糊推理的压力传感器温度补偿方法研究

温度是影响压力传感器的一个重要因素,为了补偿温度造成的误差,探讨了一种新方法,即用模糊逻辑推理的方法建立温度补偿模型进行压力传感器温度的非线性误差校正.校正后的最大

会议

基于电路三要素理论的2-5混值电路设计

本文根据2-5混值编码原理和电路三要素理论,定量设计了2-5混值门电路、触发器和带进位/借位的加减法计数器.计算机模拟验证了上述理论和依此理论设计的电路的正确性.

会议

电路三要素理论模拟验证理论设计定量设计编码原理门电路加减法计算机计数器触发器

采用钟控神经MOS管的多值触发器设计

本文首先对钟控神经MOS管进行研究,提出了相应的改进方法.然后采用此改进的钟控神经MOS管设计了一种新型多值触发器.与传统的触发器相比较,此多值触发器具有结构简单、速度快

会议

钟控神经多值触发器设计逻辑功能结构简单改进方法电路结构证明器具模拟功耗

一种新的基于相似度量的模糊推理方法

在模糊概念(用Fuzzy集表示)的隶属函数为连续和离散情况下,利用线性插值的方法给出了一个新的基于相似度量的模糊推理方法.该方法不仅具有还原性,而且还克服了传统的基于相似

会议

相似度量模糊概念推理方法规则匹配线性插值领域专家隶属函数还原性阈值缺陷

基于内省推理的多agent在线学习新方法

与本文相关的学术论文