一种基于Q学习的有限理性博弈模型及其应用

来源 :系统仿真技术 | 被引量 : 0次 | 上传用户：isnow

【摘要】

：

传统博弈理论模型建立在人的完全理性基础之上,难以切合实际。有限理性博弈则能够很好地描述实际问题。有限理性的博弈者参与到不完全信息博弈中,对博弈的规则、结构以及对手

【作者】

：

陈荣钦林君焕陈月芬

【机构】

：

台州学院数学与信息工程学院,台州职业技术学院机电学院,台州学院物理与电子工程学院

【出处】

：

系统仿真技术

【发表日期】

：

2014年3期

【关键词】

：

Q学习有限理性博弈追逐多指标收益 Q-learning limited rational game pursuing multiple indexe

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

传统博弈理论模型建立在人的完全理性基础之上,难以切合实际。有限理性博弈则能够很好地描述实际问题。有限理性的博弈者参与到不完全信息博弈中,对博弈的规则、结构以及对手等博弈信息有一个逐渐适应和了解的过程,因此博弈应是动态进化的模型。针对这一问题,提出了一种基于Q学习算法的不完全信息博弈模型,根据Littman的最大最小原则建立了多指标体系下的策略选择概率分布;构建了Q学习与博弈融合的数学模型,使用Q学习机制来实现博弈模型的动态进化;最后将模型应用于两人追逐的仿真实验,结果表明所提出的模型能够很好地再现追逐情景

其他文献

基于灰色关联分析的仿真数据可信度评估

计算机仿真系统已经发展为重要的产品开发和系统测试手段.由于仿真系统对于用户往往是透明的,所以直接从系统本身对其可信度进行评估比较复杂.仿真数据是仿真系统的直接输出,

期刊

仿真数据灰色关联分析可信度评估simulation data grey correlation analysis credibility evalua

如何做好电子病案的三日归档

"出院病案的三日归档"是4版常规及<解放军医院分级管理标准>中对于病案管理的一项根本要求,也是做好病案编目和统计工作的基础,现全军大多数医院已实施了"军卫一号工程"(即全

期刊

电子病案医院管理三日归档.NULL.

多重水印嵌入的DWT-SVD音频公开水印算法

提出了一种基于离散小波变换（Discrete Wavelet Transform,DWT）域与奇异值分解（Singular Value Decomposition,SVD）的多重嵌入数字音频水印算法.算法在嵌入水印前采用混沌加密与

期刊

多重水印离散小波变换奇异值分解鲁棒性音频公开水印multiple watermarks discrete wavelet transform si

重症急性胰腺炎术后并发急性胃粘膜损害大出血19例临床分析

1985-10～2000-12我院收治经外科手术治疗重症急性胰腺炎(SAP)术后并发急性胃粘膜损害(AGML)大出血19例,现将有关资料分析如下.1 临床资料1.1 一般资料:经外科手术证实为SAP 68

期刊

重症急性胰腺炎急性胃粘膜损害临床分析术后并发症消化道出血

腹腔大出血自体血回输228例临床分析

我院于1989－11～1999－11共收治腹腔大出血并失血性休克患者228例，均在术中收集腹腔积血行自体回输抢救，总回输血量262 200 ml，占术中输血量的90％，迅速纠正了低血容量，对保证手术顺利进

期刊

自血回输腹腔出血失血性休克并发症

陆海空新兵基础训练期间军事训练伤的流行病学调查

目的：了解我军各军种训练伤的流行病学特征，初步分析致伤原因。方法：选取陆海空三军参加１９９８年度基础训练的２４４７名新兵，统一进行流行病学调查。结果：陆海空三军总发生率２９．４％，陆军为３２．８％，海军为；２８．２％，空军为

期刊

流行病学调查军事训练伤基础训练WT5BZ]Epidemiological investigationMilitary training injury

基于粒模型的PAD情感模型描述方法

介绍了粒的基本概念和基于商空间的粒的定义、性质与定理等，通过基于商空间的粒模型建立了对PAD情感模型进行定性和定量描述的方法，最后通过例子证明了所采用的方法能够有效地

期刊

粒商空间PAD情感模型granule quotient theory emotional model of the PAD

云环境下基于SLA的工作队列调配算法研究

云计算环境下,工作任务的调度和计算资源的分配受到SLA的约束。不同的工作任务要求不同的Qo S,采用具有SLA参数的约束条件,对任务划分优先级,形成优先级队列。在对该任务分配

期刊

云计算SLA工作队列调度算法cloud computing SLA work queue scheduling algorithm

肉仔鸡腹水症的发生与防治

期刊

肉仔鸡腹水症发病机制防治措施

急性肾衰患者NAG动态观察的意义

目的:探讨急性肾衰(ARF)各期尿NAG动态观察对于该病早期预防、治疗、转归的意义.方法:用改良Ma-ruhn's法,对 31例 ARF患者分组、分期并就轻、重型病例进行尿 NAG动态性观

期刊

急性肾功能衰竭尿NAG动脉观察Acute renal failure(ARF)Urinary NAGObserve

一种基于Q学习的有限理性博弈模型及其应用

与本文相关的学术论文