爱恩斯坦棋计算机博弈系统的研究与实现

来源 :安徽大学 | 被引量 : 0次 | 上传用户:arigadordor
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机博弈,也称机器博弈,是一个极具挑战与发展前景的计算机研究领域,其作为人工智能领域一个极其重要的课题,素有人工智能领域“果蝇”之称。而对于棋类游戏的研究又是计算机博弈研究过程中的一个标准且极为重要的问题。现有的很多重要理论和技术方法诸如各类搜索算法及智能方法,最初的提出都是为了解决存在于棋类博弈中的某些问题。对于计算机博弈的研究最早可以追溯到半个世纪之前,在过去的五六十年里,人工智能的学者们呕心沥血的研究了计算机博弈中的包括奥赛罗、国际象棋、跳棋、五子棋、围棋等等,取得了大量傲人的成果。97年IBM的“深蓝”战胜棋王卡斯帕罗夫更是引起了世人的瞩目与震动,让世人第一次意识到冰冷的机器在棋类博弈上的智能超越了人类;而在不久之前,人机围棋大战巅峰对决——谷歌围棋人工智能AlphaGo VS人类顶尖棋手李世石刚刚落幕,AlphaGo以4:1击败李世石,从某种层面上来说机器的智能已经远远超过了人类。相比于国外,国内对于此方面的研究起步较晚,但是随着这几年的国内各种博弈比赛的开展,吸引了越来越多的学生与学者参与博弈的研究,国内的计算机博弈研究迎来了黄金期,极大的促进了国内计算机博弈研究的发展。传统的机器博弈模型多是完全信息博弈,即在对弈过程中完全了解其他对手的状态特征、策略和得益方式,现有的机器博弈研究大多以此类为研究载体,如五子棋、象棋等等。此种棋类的数据结构和局面状态描述设计依赖于准确的状态策略信息,搜索引擎也有现成的模板可供参考。本文的研究对象爱恩斯坦棋博弈属于不完全信息博弈,对博弈过程中的信息了解不完全,在进行数据结构和局面状态描述设计之前,需要先对其他对手的状态特征等信息进行一个估计,让博弈信息“伪完全化”,然后再进行相关设计,同样,需要对传统的博弈搜索算法进行修改,使其适应于不完全信息博弈。本文以爱恩斯坦棋博弈平台为研究载体,研究了计算机博弈关键技术,包括基本概念、研究对象分析和搜索引擎,设计了爱恩斯坦棋机器博弈系统。在棋盘数据结构设计过程中,对对手的状态信息等进行了预判和估计量化,使其信息完全化,从攻击和防守两个方向同时评估,得到了攻防兼备的估值函数;同时,还研究了估值函数的参数优化方法,保证估值函数设计的准确性和合理性;在搜索算法方面,基于传统的完全信息博弈算法——极大极小算法,参考期望搜索算法,在极大层与极小层之间人为加入一层骰子层,并将上述估值函数应用到算法中同时加入置换表优化技术,设计了适应于爱恩斯坦棋的攻防兼备的期望算法,解决了使用传统博弈算法无法构建博弈树的问题,提高博弈水平。从搜索效率和博弈水平两个角度攻防兼备的期望算法,虽然在搜索效率有所下降,但是在博弈水平方面却有较好的突破,博弈水平明显提高证明了应用了攻防兼备的估值函数的期望算法在一定深度范围内博弈水平和博弈效率取得了较好的平衡,既具有较高的博弈水平,又充分利用了博弈时间。同时,加入置换表优化方法之后,搜索效率与博弈水平都有一定的提升,本文的创新点如下:(1)研究并设计了适用爱恩斯坦棋的不完全信息博弈的数据结构,深入研究估值函数的构成,针对传统的估值函数存在的估值片面不准确的问题,从攻击防守两个方向同时考虑并结合爱恩斯坦棋的两种赢棋方式,设计了准确且效率较好的攻防兼备的估值函数;同时分析研究了一些应用于估值参数优化的方法和策略。在设计估值函数时,使用了攻击因子和威胁度因子来调整着法路径,有效的提高了博弈水平。(2)具体上采用爬山法结合手工调整对攻防兼备的估值进行参数优化,将优化之后的估值应用到算法中去,极大的提高了博弈水平。(3)基于传统的极大极小博弈算法,参考期望搜索算法,改进并设计了适用于爱恩斯坦棋的攻防兼备的期望算法,在原有的极大极小层中加入一层骰子层,来模拟投骰子的过程,解决了博弈过程中信息不完全的问题,并将(1)中的估值函数应用到算法中,加入置换表来优化算法,降低搜索过程中的节点数量,提高了搜索算法的效率。上述方法均在爱恩斯坦棋博弈系统“行云流水”与“流刃若火”程序中成功应用,其中“行云流水”在2014年“成理杯”全国大学生计算机博弈大赛爱恩斯坦棋项目荣获季军(一等奖),实践上证明本文提出的估值方法及搜索算法具有可操作性与实际应用价值。
其他文献
村干部作为农村地区事务的管理者,合理提高村干部报酬有利于提高村干部自我认同和岗位认同,有利于提高工作效率。同时,规范村干部的报酬也有利于加强村干部队伍管理,有利于提高政府的社会管理效益。近年来,C县农村地区发展迅速,农民人均纯收入快速增长,村干部的报酬也跟着水涨船高。但随着社会经济的发展,C县对村干部的报酬管理出现了一些问题。本文以需求层次理论和公平理论为基础,以C县村干部为研究对象,通过问卷调查
目的分析评价复杂踝关节损伤应用MRI与多层螺旋CT诊断临床价值。方法该次将该院于2018年1月—2019年1月收治的复杂踝关节损伤患者100例作为研究的对象,依次采取MRI诊断、多层
目的对获取的丰镐地区航空高光谱遥感数据进行前期数据处理和校正。方法通过辐射校正、噪音去除、航带间差异调整、几何校正等图像处理方法对畸变和误差较大的遥感数据进行校
安全协议作为网络空间安全的重要组成部分,是保障网络空间安全的关键和灵魂。从安全协议的设计及其抽象规范安全性的分析验证、到安全协议实施(安全协议代码),人们主要集中在
多溴联苯醚(PBDEs)作为一种持久性有机污染物,对人类的健康造成严重威胁,因此寻找高效绿色的方法降解该污染物具有重大意义。本文研究了两种光催化降解十溴联苯醚(BDE209)的方法。具体研究进展如下:1.研究了石墨烯在水相中降解BDE209的光化学还原方法。在光催化过程中,石墨烯在除氧条件下利用光生电子还原BDE209。结果显示还原石墨烯(RGO)和氧化石墨烯(GO)在无氧水溶液中对BDE209表
<正>7月25日.《理论学刊》创刊30周年暨人文社科期刊的历史责任座谈会在山东省委党校新校区召开,来自全国理论界和人文社科期刊界的专家学者70余人参加广座谈会。中共山东省
生境片断化对生态系统中物种的维持造成了严重的威胁,隔离形成的小种群面临着灭绝的危险。本文选择片断化典型地区—浙江省淳安县千岛湖东南湖区10个岛屿及周边地区为研究地
冬小麦是我国的主要粮食作物,其生产对我国粮食安全至关重要。河南省是我国粮食生产核心区,冬小麦产量占全国小麦总产量的25%以上,近年来晚霜冻害频繁发生,对冬小麦产量品质影响较大,严重可致冬小麦绝收,对河南省的冬小麦晚霜冻害进行监测和产量预测有重要意义。本文以物联网技术和遥感技术为依托,选择合适的空间插值方法构建河南省温度曲面,基于构建的温度曲面对河南省冬小麦是否发生晚霜冻害进行监测,结合极端低温(F
中华优秀传统文化是涵养社会主义核心价值观的重要源泉,社会主义核心价值观传承了中华优秀传统文化的道德内核,是中华优秀传统文化在新形势下的发展,要以科学的态度对待中华传统
东莞市虎门镇中元古代长安岩组岩性组成复杂,主要由变质砂岩类、石英岩类、片岩类、片麻岩类和混合岩化岩类等组成。锆石U.Pb定年结果表明,该岩层具有古元古代成因年龄的记录