【摘 要】
:
传统博弈理论模型建立在人的完全理性基础之上,难以切合实际。有限理性博弈则能够很好地描述实际问题。有限理性的博弈者参与到不完全信息博弈中,对博弈的规则、结构以及对手
【机 构】
:
台州学院数学与信息工程学院,台州职业技术学院机电学院,台州学院物理与电子工程学院
论文部分内容阅读
传统博弈理论模型建立在人的完全理性基础之上,难以切合实际。有限理性博弈则能够很好地描述实际问题。有限理性的博弈者参与到不完全信息博弈中,对博弈的规则、结构以及对手等博弈信息有一个逐渐适应和了解的过程,因此博弈应是动态进化的模型。针对这一问题,提出了一种基于Q学习算法的不完全信息博弈模型,根据Littman的最大最小原则建立了多指标体系下的策略选择概率分布;构建了Q学习与博弈融合的数学模型,使用Q学习机制来实现博弈模型的动态进化;最后将模型应用于两人追逐的仿真实验,结果表明所提出的模型能够很好地再现追逐情景
其他文献
计算机仿真系统已经发展为重要的产品开发和系统测试手段.由于仿真系统对于用户往往是透明的,所以直接从系统本身对其可信度进行评估比较复杂.仿真数据是仿真系统的直接输出,
"出院病案的三日归档"是4版常规及<解放军医院分级管理标准>中对于病案管理的一项根本要求,也是做好病案编目和统计工作的基础,现全军大多数医院已实施了"军卫一号工程"(即全
提出了一种基于离散小波变换(Discrete Wavelet Transform,DWT)域与奇异值分解(Singular Value Decomposition,SVD)的多重嵌入数字音频水印算法.算法在嵌入水印前采用混沌加密与
1985-10~2000-12我院收治经外科手术治疗重症急性胰腺炎(SAP)术后并发急性胃粘膜损害(AGML)大出血19例,现将有关资料分析如下.1 临床资料1.1 一般资料:经外科手术证实为SAP 68
我院于1989-11~1999-11共收治腹腔大出血并失血性休克患者228例,均在术中收集腹腔积血行自体回输抢救,总回输血量262 200 ml,占术中输血量的90%,迅速纠正了低血容量,对保证手术顺利进
目的:了解我军各军种训练伤的流行病学特征,初步分析致伤原因。方法:选取陆海空三军参加1998年度基础训练的2447名新兵,统一进行流行病学调查。结果:陆海空三军总发生率29.4%,陆军为32.8%,海军为;28.2%,空军为
介绍了粒的基本概念和基于商空间的粒的定义、性质与定理等,通过基于商空间的粒模型建立了对PAD情感模型进行定性和定量描述的方法,最后通过例子证明了所采用的方法能够有效地
云计算环境下,工作任务的调度和计算资源的分配受到SLA的约束。不同的工作任务要求不同的Qo S,采用具有SLA参数的约束条件,对任务划分优先级,形成优先级队列。在对该任务分配
目的:探讨急性肾衰(ARF)各期尿NAG动态观察对于该病早期预防、治疗、转归的意义.方法:用改良Ma-ruhn's法,对 31例 ARF患者分组、分期并就轻、重型病例进行尿 NAG动态性观