基于机器学习的围棋策略网络模型的数据优化

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:zsq789456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
围棋自从被创造出来,到如今已经有几千年的历史。这项游戏的规则简单,但是难度却非常高,计算机围棋决策问题也一直都是人工智能领域所面临的一大难点,19路围棋(棋盘大小为19*19)博弈树的复杂度大概为10的300次方[1],如果只靠普通的算法和硬编程是无法解决这个问题的。传统的计算机围棋AI在加入了大量的围棋知识后,在面对人类职业棋手时,仍需要被让3-4子才有一战之力。在DeepMind团队[2]将深度卷积神经网络引入围棋策略之中,计算机围棋发展有了重大的飞跃。原本需要让3子左右才有希望战胜一般职业围棋选手,经过改良已经可以和顶尖职业九段围棋选手一较高下。随着人工智能在计算机围棋方面的重大突破,DeepMind所应用到的卷积神经网络网络模型被更多的使用到了各行各业之中。首先,本文介绍了卷积神经网络的基本原理以及如何将卷积神经网络技术应用到计算机围棋决策问题中;并给出了本文参考 DeepMind团队所提供的模型设计出的培养计算机围棋AI棋感的策略网络结构。其次,说明了应用到计算机围棋中的卷积神经网络所需要的输入是什么,详细的介绍了本文从原始棋谱数据获取到制作数据集的整个过程。最后,讲述了为了训练本文设计的卷积神经网络所使用的机器学习平台以及训练所采取的方式,并讲述了训练时候碰到的问题和如何克服这些问题;对于训练出的卷积神经网络结果做出了阐述,并分析了这个结果,提出了为了使结果更好所能做出的改进方法和措施。
其他文献
经济的发展和城市化进程的加快,使得建筑工程不断的增加,这也使得建筑产品的附属行业得到更好的发展,其中物业管理企业也获得了飞跃性的发展。物业管理的内容多而且复杂,同时
<正>中非基础设施合作是"一带一路"倡议下中非合作的重点,也是2015年末习近平主席宣布实施的中非"十大合作计划"的重要内容。近三年来,中国与非洲在基础设施规划、设计、建设
今年是中国共产党成立90周年,在党的领导下,我国现代化各项事业都取得了令人瞩目的成就。目前,上海正按照2020年基本建成"四个中心"和社会主义现代化国际大都市的目标,全力推
理清政党文化与政治文化和执政文化的关系是做好政党文化研究工作的基础.政治文化为政党文化提供了理论基础和分析框架,政党文化不能等同于政治文化,二者在文化主体、价值驭
目的:对比分析超声影像和钼靶X线检查在诊断乳腺癌中的临床价值。方法:收集69例经超声、钼靶X线检查,诊断为乳腺疾病的患者,然后分别与病理诊断相比较,并对两者进行有关的统
近几十年来,由于模锻件的大型化,对切边压力机的吨位要求也越来越大。鉴于制造大型机械切边压力机有困难,国内外都设计制造了大型切边液压机。
我国拥有世界上规模最大的科技人才资源,但在人才供给结构上呈现出明显的断层,高尖端核心技术人才、卓越工程师以及领军型人才供给不足,存在着结构性失衡现象。在大众创新、
农村教师幸福感是教师在客观的教育教学过程中、在现实生活环境下获得的一种满足,是主体自身的一种积极的情感体验。农村教师的幸福感由物质需求、主体体验、精神满足、公众
随着我国城市化的进一步发展,一些城市在不断地进行开发区土地的利用。这种大规模土地利用的行为,在一定程度上造成了一系列的问题。这些问题的存在,影响着我国经济社会的可
建筑排水行业挑战和机遇同在,我们应该准确把握其发展进程,做出恰当的应对,来推动本行业的技术进步。