基于静态评估的计算机围棋UCT算法改进研究

被引量 : 0次 | 上传用户:yp0202
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机博弈是人工智能研究的重要领域之一,棋类博弈又是计算机博弈中的重要分支,目前其他棋类博弈均得到了较圆满的解决,唯有计算机围棋的最高水平还不及人类的初级棋手。围棋是检验人工智能发展水平的试金石,开发出与职业棋手程度相当的计算机围棋程序有助于对人类认知科学的探索。对当前棋局做出准确高效的静态评估不仅有利于棋手判断当前局势,确定攻防着点,引导下一步棋的走向,而且能够指导信心上界树(Upper Confidence bounds applied to Trees,简称为UCT)算法平衡探索与利用。本文提出了一种棋子影响函数,并在此基础上构建了一个量化模型来解决棋局的静态评估问题;然后将静态评估结果与UCT算法相结合,构造出一种UCT剪枝策略。本文所设计的算法可以提高程序的运行效率,从而提升程序棋力,具有一定的理论研究意义与实际应用价值。本文主要研究成果有:(1)设计了一种棋子的影响函数Influ。过去的影响函数通常没有考虑到对方棋子的阻挡问题,从而造成计算影响值时精度较低。本文采用直线和斜线距离相结合的方式来表征棋子到空点的距离,并利用A*算法进行路径寻优,最终获取单个棋子对空点的影响值;(2)基于Influ棋子影响函数,构造Value全局静态评估量化模型。首先,将单个棋子对空点的影响值线性叠加;然后,进行边角调整、阈值规范和归一化操作等处理步骤,获得棋盘上所有空点受到的总的影响值;最后,使用多级种群竞争消亡法优化模型参数,最终得到Value量化模型。实验表明,Value模型的计算结果与职业棋手的判断非常接近,计算精度适用于棋局的序盘和中盘阶段,为后续的剪枝策略奠定了基础;(3)将Value模型获得的静态评估结果与UCT算法相结合,构造剪枝策略Static。利用静态评估值作为节点的评分标准,以此减少搜索深度,从而在单位时间内增加蒙特卡罗模拟次数,并指导搜索偏向有意义的方向。实验表明,Static剪枝策略可以提高搜索效率,进而提升程序的棋力。
其他文献
<正> 我们在有关单位的支持下,研制了一条电子控制粗纱自动运输线,1980年4月在4台粗纱机、23台细纱机上投入三班运转,8月底省内鉴定认为:结构比较简单、合理,运行较为稳定,可
分析广西新型城镇化建设现状和广西高职教育发展状况,提出广西应按照新型城镇化的内涵要求对高职教育进行转型调整,优化高职教育专业设置,建立和完善高职教育转型的多元化保
上世纪八十年代末,我国学者对篮球方面的研究呈现出爆膨式发展趋势。经过不完全统计,有关篮球的研究文献截止目前为止已经达到了两万多篇,足以见得人们对篮球运动重视程度。
目前规划工作实践中存在许多问题,使大部分旅游规划不能彻底执行,难以满足规划市场的需求。旅游规划主要是通过对目的地资源与市场,特别是资源适应性和市场潜在性的调查,来组
<正>一、同义词的定义及其来源 英语中的同义词叫synonym,它源于希腊语,由syn(意思是together)加onymon(意思是name)构成。英语的同义词极其丰富,我们从C.E.Eckersley和J.M.E
在保留C2-NH2抗菌活性基团的基础上,以DCC为脱水剂制备了具有双抑菌活性中心的水杨酸低聚壳聚糖酯(SEC),并对其抑菌活性进行了研究。结果显示,SEC最佳合成反应条件为:n(低聚
目的:了解冠心病人群体型特征,为预防和早期诊断冠心病及指导其饮食、运动等提供参考。方法:2003-05/09在本溪钢铁有限责任公司总医院和本溪市中心医院循环内科住院及门诊治
利用1980-2007年数据,通过计算基尼系数、省区区位商研究劳动密集型产业的地理集中程度和专业化水平的变化趋势,探讨改革开放以来我国劳动密集型产业地理格局的变化。研究发
高职"后进生"不良行为转化一般要经历醒悟、转变、反复、稳定等几个过程,辅导员在不同的阶段运用不同的心理效应可以帮助高职"后进生"更好地转化,矫正其不良行为。
在观察和分析的基础上,探讨了目前我国高校英语专业的学生在英语语音方面存在的问题,以及英语语音教学和口语教学方面存在的不足,提出将英语语音课与口语课相结合,在口语训练