双人博弈问题中的蒙特卡洛树搜索算法的改进

来源 :计算机科学 | 被引量 : 0次 | 上传用户:c948221078
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蒙特卡洛树搜索(MCTS)是一种针对决策类博弈游戏,运用蒙特卡洛模拟方法进行评估博弈策略的启发式搜索算法。但是,在面对计算机围棋这种复杂的决策过程时,简单的蒙特卡洛树搜索过程往往由于计算量大,收敛速度非常慢。由于双人博弈游戏中的蒙特卡洛树搜索不能收敛于双人博弈的最佳决策策略,因此提出蒙特卡洛树搜索结合极大极小值算法的改进算法,使得搜索结果不会因为蒙特卡洛方法的随机性而失真。为了进一步提高复杂双人博弈游戏中搜索算法的计算效率,还结合了几种常见的剪枝策略。实验结果说明,所提算法显著改进了蒙特卡洛树搜索的准确性
其他文献
目的:探讨采用4-1BBL联合sPD-1及单独使用IFN-γ对B16小鼠进行基因治疗,然后停止一段时间(7days),观察残余瘤组织中MMP-2、MMP-9的变化及借此评价治疗的效果。方法:将一定剂
<正>~~
期刊
绩效管理与考核作为企业战略目标的重要组成部分,对企业发展有着极为重要的作用,它能够优化人力资源配置,提升企业内部员工的工作效率。基于此,本文首先阐述了企业绩效管理的
包装材料的发展是随着包装业的发展 ,科技的发展以及人类的需要 ,社会整体发展的需要而不断发展和演变的。包装材料是形成商品包装的物质基础 ,是商品包装所有功能的载体 ,是
分析了“互联网+”视阈下中国绿色农产品营销存在的问题,提出了以完善的宏观市场环境为前提,以满足消费者需求为营销核心,以先进的营销传播理念为指导,打造绿色农产品品牌绿
以双头季铵盐C18-6-6Br2为辅助模板剂,分别通过水热法和蒸汽相法合成了具有特殊形貌的EU-1分子筛。利用XRD、SEM、NH3-TPD和N2吸附-脱附等手段对样品进行表征,使用二甲苯异构
文章介绍高清非编系统发展现状,以中科大洋公司的D3-Edit3.0高标清非线性编辑系统为例,介绍其主要特点和技术要点,并以实例介绍此系统的实际应用情况。
招投标是建筑工程造价控制的关键环节,这一环节在整体项目造价控制中发挥直接作用。所以,企业必须对招投标环节的造价控制进行重视,实施有效的手段,尽可能的节省项目成本,对
目的:采用表面增强激光解析电离飞行时间质谱技术(surface-enhanced laser desorption/ionization time-of-flight mass spectrometry, SELDI)检测前列腺癌无骨转移患者及骨转
格助词“に”和“で”都是日语助词中用法较多的助词,非母语学习者对两者的用法及区别时感困惑。本文拟从这两个词的主要用法中挑选表场所、原因、时间、动作状态的主体等语义