围棋博弈机器学习算法的研究及应用

被引量 : 0次 | 上传用户:shqcd992
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人工智能在现今社会中早已被充分运用至各个领域,如航天、军事、制造、商业、医学等等。而机器学习最初的研究目标则是让计算机系统具有人‘学习’的能力,以便实现人工智能。机器博弈作为研究人工智能的载体,有着如‘果蝇’在研究遗传基因时的良好优势。为此,机器博弈也被称为人工智能研究的‘果蝇’。围棋作为众多博弈游戏中的一种,有着复杂的状态空间。这直接意味着围棋机器博弈研究,亦有着相当的难度。将机器学习应用至围棋机器博弈中,让围棋博弈系统拥有自学习能力,以达到‘智能’的博弈。本文将围棋机器博弈系统看作一个博弈智能体,该智能体利用已有的棋谱知识或称经验知识,通过不断地试探性下棋,从中获取可利用知识,寻找当下或几个步骤之内的最优步伐,以求胜利,并最终完成下棋。这个过程总的概括为一个‘搜索’过程,在这个搜索过程中,博弈智能体通过一定的方法对经验进行学习,最后获得可用知识,达成目标。文章主要分析了如下几个问题:1.阐述博弈相关概念,机器博弈常用算法,以及围棋机器博弈的特点及关键技术;分析机器学习对智能的重要作用,以及在围棋机器博弈中应用机器学习算法的意义;2.介绍机器学习在围棋机器博弈中的解决方法,包括蒙特卡洛思想、人工神经网络以及增强学习。其中,重点介绍了增强学习中时间差分算法的原理机制与应用。建立了基于时间差分算法的围棋机器博弈系统的模型,并运用至重理工‘骑士队’围棋机器博弈中;3.量化围棋博弈动作,改进应用在围棋机器博弈中的时间差分算法,将经过时间差分算法学习后的棋盘状态值作为选取动作后所得的奖励之一,使博弈智能体获得更接近真实的棋盘信息。4.采用围棋机器博弈平台实际对弈方式进行试验,不断进行对弈学习,逐步提高博弈能力;通过大量实验及训练,并比较算法应用前后、改进前后博弈智能体的博弈水平,验证采用时间差分算法与改进效果。部分研究成果参加了全国比赛,取得了不错的成绩,这些都表明了本文算法设计的有效性。
其他文献
圆锥滚动轴承的精度、振动和可靠性对减速器的性能起着决定性的作用。其正常的失效形式是滚动体或内外滚道上的点蚀破坏。这种破坏是在齿轮安装、润滑、维护很好的条件下,轴
<正> 黄鼬是种长相很可爱、名声却不怎么样的小家伙,黄鼠狼、黄皮子、黄狼等都是它的别名,也就是外号。黄鼬是动物属哺乳纲食肉目鼬科中很常见的一种小型兽类,体形细长,四肢
期刊
生态文明、建设生态文明、生态文明建设,是从中国语境中产生出来的话语词汇,是社会主义生态文明理论体系的三个基本概念,也是坚持和发展中国特色社会主义文明的三个关键词。
<正>张全景,男,1931年生,山东省平原县人。1946年2月参加革命,1949年9月加入中国共产党。历任中共山东省德州市委副书记,中共山东省委组织部副部长,中共山东省委第四届委员会
杭州灵隐寺的旅游业要与佛教文化共赢发展。本文在广泛观察和访谈调查的基础上,分析了游客对灵隐寺的感知。调查表明,灵隐寺的宗教功能与旅游功能并行发展,基础设施建设良好,
发酵时间、发酵温度、接种量、原料奶及配料、生产发酵工艺及设备、生产环境和卫生状况等方面都对酸乳品质有一定的影响。本论文对发酵时间、发酵温度、接种量、糖的添加量等
畜牧业是我国农业经济重要的组成部分,内蒙古自治区是以畜牧业为支柱的畜牧业大区,内蒙古牧区肉羊产业又是内蒙古畜牧业的龙头产业。牧区肉羊产业无论从经济学,还是从文化学
在"国家治理"理念下探讨意识形态安全问题,既是意识形态安全理论本身的内在要求,又是国家治理实践的迫切需要。意识形态作为国家的精神内核,就像血液一样渗透在国家的整个肌
藏彝走廊的南北方向有着漫长的延长线。在藏彝走廊的北方,由甘青高原向东延伸,并越过北方草原地带,直到俄罗斯;藏彝走廊的南方,由横断山向南,一直伸展到中南半岛。因此,藏彝
本文主要研究了沪深300股指期货推出后,股指期货和股指的相关性。文章首先检验了沪深300股指期货和股指的价格关系,接着分析了沪深300股指期货的推出对股指市场波动性的影响