基于内省推理的多agent在线学习新方法

来源 :2005年中国模糊逻辑与计算智能联合学术会议 | 被引量 : 0次 | 上传用户:yymmttjjjj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多agent环境下agent的最优策略取决于其他agent的策略,这使得学习目标不易被清晰的定义.基于客观观察行为建模的方法并不保证学习策略最终收敛.本文提出了基于内省推理方法的多智能体环境下智能体高效在线学习方法,将基于对手模型的客观观察行为与基于换位思考推理的主观意图推测结合起来.仿真结果证实了算法在电子市场定价中的有效性.
其他文献
目的 探讨胃肠外科手术中不规范使用管状吻合器而导致吻合口梗阻发生的原因及预防对策.方法 回顾性分析2005年7月至2016年7月期间于笔者所在医院接受胃肠道手术且在术中使用
期刊
@@
本文意图将Lambek演算LC中的范畴概念推广到模糊模糊范畴,从而使LC推广为模糊Lambek演算FLC,并给出易于应用的简化演算FLC*.通过示例的成功应用,说明FLC是LC的一种合适的推广
本刊讯 我国的一项劳动保护科研成果──由黑龙江省劳动保护研究所研制的GS系列隔声、阻尼、防辐射材料(见本刊11期报道),最近在第36届世界发明博览会上首次获得金奖。我国劳
手术完全切除肝/肺转移灶仍是目前治愈结直肠癌肝/J|肺转移的最佳方法,推荐符合手术适应证的患者在适当的时机接受手术治疗初始不可切除的患者推荐经多学科团队讨论后,行全身
期刊
@@
本文分析了逻辑函数在部分变量取反时的或-符合展开系数图(即dj图)和降维或-符合展开系数图(即降维dj图),在此基础上提出了用dj图和降维dj图计算逻辑函数的一阶布尔差分和二
G(o)del语言是一种说明性逻辑程序设计语言.该语言基于一阶逻辑,支持抽象数据类型和模块化程序设计等技术,语言本身也具有很强的说明性语义.本文引入了在G(o)del语言中支持面
温度是影响压力传感器的一个重要因素,为了补偿温度造成的误差,探讨了一种新方法,即用模糊逻辑推理的方法建立温度补偿模型进行压力传感器温度的非线性误差校正.校正后的最大
会议
本文根据2-5混值编码原理和电路三要素理论,定量设计了2-5混值门电路、触发器和带进位/借位的加减法计数器.计算机模拟验证了上述理论和依此理论设计的电路的正确性.
本文首先对钟控神经MOS管进行研究,提出了相应的改进方法.然后采用此改进的钟控神经MOS管设计了一种新型多值触发器.与传统的触发器相比较,此多值触发器具有结构简单、速度快
在模糊概念(用Fuzzy集表示)的隶属函数为连续和离散情况下,利用线性插值的方法给出了一个新的基于相似度量的模糊推理方法.该方法不仅具有还原性,而且还克服了传统的基于相似