多人不完备信息博弈的一种解法及改进

来源 :武汉大学学报(工学版) | 被引量 : 0次 | 上传用户:jimmyreagan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多人不完备信息博弈是一类存在私有信息而出现信息不完备、不对称的多人博弈.以扑克牌游戏这类典型的多人不完备信息博弈为原型提出一般动态博弈模型GDGM.在该模型框架下,提出一种基于MU算法的多人不完备信息博弈算法MMU,并将MMU算法分别与经典博弈算法Paranoid和MCTS结合,消除该算法对经验值的依赖.最后实验从胜率和得分两个角度对算法进行评价.结果表明,结合了经典博弈算法Paranoid和MCTS算法的PN-MMU和MT-MMU算法可有效处理以扑克牌游戏为代表的多人不完备信息博弈问题,并且与PN-MMU相比,MT-MMU具有更好的博弈能力. Multiplayer incomplete information game is a kind of multiplayer game with incomplete information and asymmetric information in the presence of private information.The general dynamic game model GDGM is proposed by taking the typical multiplayer incomplete information game such as poker game as prototype. Under the framework of the model, a multi-person incomplete information game algorithm MMU based on the MU algorithm is proposed, and the MMU algorithm is combined with the classical game algorithm Paranoid and MCTS respectively to eliminate the dependence of the algorithm on the experience value.Finally, The results show that the PN-MMU and MT-MMU combined classical game algorithm Paranoid and MCTS can effectively deal with the multi-person incomplete information game represented by poker game, Compared with MMU, MT-MMU has better gaming ability.
其他文献
研究了经脉冲电流和常规电阻炉奥氏体化热处理后30钢晶粒大小的变化,结果表明在同等的奥氏体化加热温度和加热时间及冷却速度的实验条件下,经电阻炉处理后试样的金相组织与原
以硝酸钙和磷酸氢二铵为原料用化学共沉淀法制备纳米羟基磷灰石(n-HA),用XRD、TEM 和BET表征样品的相组成、结晶形貌和比表面积.结果表明:制备的针状羟基磷灰石长轴约为31.9n
E2F家族由8个E2F基因(E2F-1 ~8)及3个DP基因(DP1、DP2/3、DP4)组成.E2Fs基因根据其保守序列和转录活性的不同分为不同亚组.E2Fs家族成员既是转录激活因子同时也可作为转录抑制因子,以往研究报道E2F-1~3可转录激活与细胞周期进程及核苷酸合成相关的基因,如细胞分裂周期蛋白6(CDC6)、细胞周期素(Cyclin)E和二氢叶酸还原酶;E2F-4 ~6可抑制其他E2F基因
期刊
采用静态增重法测定2520不锈钢在高温条件下的氧化动力学,运用X射线衍射测定氧化物类型,运用扫描电镜(SEM)观察不同氧化时间形成的氧化膜的形貌,通过能谱分析(EDS)氧化膜的成
“趣城”呈现出城市规划的一种新模式。区别于之前城市规划体现出的强烈系统性、整体性、宏大叙事,对城市发展的高远目标的追求。“趣城”没有设定所谓的宏大目标和规矩体系,
肿瘤的发生与机体免疫稳态密切相关,肿瘤免疫逃逸常通过参与肿瘤的发生、增殖与浸润而造成机体对恶性肿瘤无应答或低应答反应.肿瘤微环境中存在多种具有抑制免疫功能的细胞及细胞因子,抑制体内效应细胞的抗肿瘤活性[1].其中调节性T细胞(Treg)与转化生长因子(TGF-β)在肿瘤的发生、发展中起重要调节作用[2].控制Treg产生与其他肿瘤疗法相结合以提高抗肿瘤效应,研究Treg与TGF-β的关系将为肿瘤免
期刊
【摘 要】基于WEB的测评系统可以充分发挥现代信息技术的优势,实现测评的透明化。文章首先分析了基于WEB的测评系统的开发背景及功能需求,进而对系统的数据库进行了分析与设计。  【关键词】WEB 测评系统 随机登录码  一、基于WEB的测评系统开发背景  每到学年末,很多学校都要对中层干部、教师、系部及职能处室进行年终测评。这项工作通常由人事处来完成,其流程为:制定测评项,印刷成测评单,然后组织相关
“趣城”是令人兴奋的项目!与其说是项目,不如说是尝试,是严谨的官僚机制与散漫的创作机制间大胆的嫁接实验。“趣城”是建筑师主动发现城市问题,进而向政府提出动议,经过碰
目的比较肝硬化患者和非肝硬化患者的单个小肝细胞癌(长径≤5 cm)手术切除疗效,探讨肝硬化对单个小肝细胞癌切除术后复发和患者长期生存的影响。方法采用回顾性研究方法,将2001年4月至2009年10月在我院肝脏外科中心接受肝切除术的单个小肝细胞癌患者共256例分为非肝硬化组(44例)和肝硬化组(212例),比较两组患者的无瘤生存率和总体生存率。男性227例,女性29例;年龄14~79岁,中位年龄49