计算机围棋中的算法研究

被引量 : 0次 | 上传用户:sunyb_sky
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
博弈是人工智能的重要研究主题,人工智能的发展在很大程度上得益于博弈研究的发展。作为博弈研究的主要内容之一,棋类博弈得到了满意的解决,唯一的例外的是围棋,目前最优秀的围棋程序的水平还不及人类初级棋手。由于围棋的搜索空间太大、计算机难于处理模糊概念且难于设计学习算法,造成了计算机围棋程序的棋力难于提高。围棋是检验人工智能发展水平的良好环境,如何提高围棋程序的棋力是人工智能领域的一大难题。同时,开发出与人类棋手水平相当的围棋程序也有助于对人类认知能力的理解。所以计算机围棋研究具有重要的理论意义和实用价值。我们首先介绍了国内外计算机围棋研究现状,包括基础算法、搜索算法和学习算法三方面并介绍了部分计算机围棋程序,认为计算机围棋的搜索算法主要有minmax算法、alphabeta算法、failsoft算法、negmax算法、negscout算法和mtdf算法等等,涉及到的学习算法和理论基础主要有组合博弈理论、数学形态学、蒙特卡罗算法、模糊学习、分治法、强化学习算法、遗传算法、神经网络、支持向量机、贝叶斯模式分类、基于解释的泛化和并行算法等等,指出了目前研究中存在的主要不足主要表现为局面表示法欠完善、中盘策略欠完整以及学习算法欠成熟。然后,我们简述了本研究的相关理论基础,包括数学形态学、有限状态机、线性模型、感知机与遗传算法。接着,我们阐明了本研究提出的棋手思维模型、基础算法、搜索算法、学习算法及相应实验结果。具体说来,我们完成的主要工作与创新点包括以下几个方面:一、提出了一个完整的棋手思维模型。这是在提出了领土领海和领空等地域概念、提出了局面的层次表示法、归纳并分类了大量围棋术语、提取了目标概念、建立了目标图、总结了若干目标选择原则和走步属性并分析了棋风概念的基础上完成的。这个模型的特点在于它的完整性和围棋术语的分类、目标选择原则与走步属性的全面性。二、设计了基于数学形态学的局面层次表示法、棋群聚类算法和地域划分算法。这些有统一理论基础的算法计算简单,实验结果表明其效果良好。利用已有的数学形态学理论可以设计更多有意义的启发式策略。三、设计了PEMIS模式编码方法。它基于模式的邻近特征、行列特征和轮廓特征进行编码,其突出优点是与模式的黑白对称性、旋转与翻转对称性以及平移对称性均无关,实验结果表明这种模式编码方法性能良好。在基础算法方面,我们还设计了一种走步增量算法。四、设计了复合目标搜索算法。我们认为复合目标可看作是由“与”或“或”关系构成的单一目标的二维向量。复合目标搜索算法的优点是其调用的基本函数可由单一目标搜索算法的基本函数合成。我们还比较了经典搜索算法的性能。五、设计了PEMIS模式库与定式库学习算法。实验结果表明了其有效性,最终学习到的模式库与定式库占用的空间比较小。另外,还设计了ZOBRIST定式库学习算法,实验结果也表明了其有效性。在学习算法方面,我们还设计了棋形与气术语的示教学习算法和棋风模型的遗传学习算法。六、开发了以此棋手思维模型为核心的计算机围棋程序ShoutGo,实现了上述各算法。ShoutGo认为棋手拥有模式库和定式库,有各自的棋风;棋手在完成棋群聚类和地域划分后,在目标选择原则的指引下以对方最后所下之子为焦点进行目标猜测,同样在目标选择原则及棋风的指引下生成特定目标,继而以目标为导向在各自的模式库和定式库推荐走步的作用下进行搜索发现走步,再根据走步属性选取特定走步,如果目标不成功或无可行走步,则重新进行地域划分或根据其它决策原则生成其它目标,直到发现合适走步;在这一过程中,模式库和定式库影响了走步的推荐,棋风影响了目标之间的跳转。最后,我们探讨了棋手思维模型的评价、走步增量算法与走步扫描算法的关系、数学形态学方法在基础算法中的应用、劫与共活现象对搜索的影响、搜索树特点与心理因素的关系、搜索时间估计、局面评价函数、目标搜索的可学习性以及棋风建模等问题,并探讨了机器学习方法在计算机围棋中的应用可能性,提出了进一步的研究计划。计算机围棋研究作为人工智能领域的一个分支,与心理学有着天然联系。我们在研究过程中,特别强调以人类棋手为本的原则,力求棋手思维模型与人类棋手真实思维过程的高度契合,力求其学习算法的完善。我们今后的研究重点将在学习算法上,能象人类棋手一样地不断地学习,计算机围棋才有希望。
其他文献
<正>人口老龄化及老龄人群生理、心理的特殊性,决定了慢性疾病的多发,严重损害了城乡居民身心健康和生活质量,给社会、家庭和个人带来了沉重的负担。为了能更好地控制老龄化
煤炭作为我国主要的基础性能源,在国民经济发展中有着重要的战略地位,但又是生态环境破坏的主要根源、可持续发展的根本制约。煤炭物流作为煤炭产业中的一个重要环节,同样也
以水生植物的景观与生态价值为基础,分别从生境和景观美学两个角度出发,探讨了水生植物在城市景观水体中配置的基本原则和方法,为水生植物在不同水体中的合理应用提供参考.水
目的:对国内外近年来建立椎间盘退变动物模型的方法及原理进行回顾,并对比各种方法的优缺点及临床相关性,探讨具有操作方法简便,可重复性强的椎间盘退变动物模型建立方法。资
目的:讨两种浓度胎牛血清培养的不同传代次数的骨髓间充质干细胞探在生长特性及表面标志方面的差异性。方法:实验于2004年在中山大学附属第二医院林百欣医学研究中心进行。取
人性假设理论,是管理学和经济学的立论基础。基于不同的人性假设理论,管理学史上形成了种种不同的管理方法理论,经济学上则把它作为分析经济现象的理论前提之一。随着社会的发展
鱼腥草(蕺菜)(Houttuynia cordata Thunb.)隶属于三白草科(Saururaceae)蕺菜属(Houttuynia Thunb.),为多年生草本植物。鱼腥草是一种传统药用植物,又是产于民间的特味野菜。2001
目的分析不同中医辨证分型初诊胃癌患者预后影响因素,确定初诊时胃癌中医辨证分型是否为胃癌独立的预后因素。方法①选择2000-01/2001-12福建省肿瘤医院中西医结合科收治的初
随着市场经济的迅速发展,机电产品不断增加,市场竞争十分激烈,机电产品企业不断寻求市场营销人才来获得更多的市场份额。本文旨在探索机电产品的市场营销人才培养方案并希望
居住是人类最基本的生活需要,城市人的一生约有三分之二的时间是在居住小区内度过,因此,居住小区是城市人生存、发展的基地。而居住景观的质量对人类的发展,进而对城市社会经济的