残差策略网络在计算机围棋的应用研究

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户：seanzhow

【摘要】

：

虽然近年来人工智能技术在各个领域中迅速发展,但是围棋因其自身的复杂度一直以来都是人工智能领域中的难解之题,一直到两三年前,国际学术界仍普遍认为真正解决围棋问题至少

【作者】

：

吴修竹

【出处】

：

北京邮电大学

【发表日期】

：

2018年01期

【关键词】

：

人工智能计算机围棋深度学习策略网络残差网络

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

虽然近年来人工智能技术在各个领域中迅速发展,但是围棋因其自身的复杂度一直以来都是人工智能领域中的难解之题,一直到两三年前,国际学术界仍普遍认为真正解决围棋问题至少需要10到20年的时间。为了解决这一问题,DeepMind公司设计的AlphaGo计算机围棋将卷积神经网络带入到计算机围棋的问题中,通过该方法AlphaGo战胜了代表围棋职业棋手顶尖水平的李世石九段与柯杰九段,宣告了人类真正在人工智能领域上解决了围棋问题,而如何进一步提高计算机围棋棋力成为学者们继续探索的方向。提高计算机围棋棋力的主要方法是提高计算机围棋中卷积神经网络的正确率,但是随着网络层数加深,卷积神经网络会因为网络过于复杂出现过拟合的情况。前微软研究员何凯明法发明的深度残差网络有效的解决了这一问题,深度残差网络可以极大的增强深度学习网络的表达能力,使其能够轻松的训练高达150层的网络,从而实现网络精度的提高。本文在研究AlphaGo中策略网络模型的基础上,设计了策略网络与深度残差网络相结合的残差策略网络,从而实现计算机围棋棋力的提高。本文首先对AlphaGo中的策略网络模型以及深度残差网络的基本原理进行了研究。其次根据策略网络的要求进行数据收集、整理以及处理的工作,并根据这些数据复现了 AlphaGo的策略网络。之后本在此基础上本文完成了对残差策略网络的数据,并使用相同数据对残差策略网络进行了实现与训练。最终经过实验比较发现,残差策略网络与比原始的策略网络相比具有更高的精度,可以有效的提高计算机围棋的棋力。

其他文献

成对约束的属性加权半监督模糊核聚类算法

在机器学习和数据挖掘中,带约束的半监督聚类是一个活跃的研究领域。为了利用约束条件获得表现更优异的聚类效果,提出了一种成对约束的属性加权半监督聚类算法,该方法充分考

期刊

半监督聚类成对约束核模糊聚类semi-supervised clustering pairwise constraints kernel fuzzy c

A study of the strong pulses detected from PSR B0656＋14 using the Urumqi 25-m radio telescope at 154

We report on the properties of strong pulses from PSR B0656+14 by analyzing the data obtained using the Urumqi 25-m radio telescope at 1540 MHz from August 2007

期刊

射电望远镜脉冲检测乌鲁木齐强脉冲PSR平均脉冲对数正态分布脉冲能量stars：neutron-pulsars-pulsars：individua

山南市成立首个金融电商惠民服务站

日前，山南市金融精准扶贫产业试点县暨金融电商惠民服务站授牌仪式在扎囊县隆重举行。据悉，首个金融电商惠民服务站除了办理传统的助农取款业务外，还新增加人民币兑残换零、金融

期刊

综合服务站金融惠民取款业务授牌仪式扶贫产业知识宣传信贷需求

中国成为世界过度包装最严重的国家

许多商品是需要包装的。包装最直接的功能是延长其保质期,或使之便于运输、携带且不受污染、损害。除了这些实用功能外,被包装的商品属性还催生了包装的非实用性功能：以包装增

期刊

商品属性产品售价现实生活性功能畸形消费违反规定标准计算循环经济奢侈浪费资源浪费

某双前轴自卸车转向系统的匹配设计

本文以阿克曼原理为基础,对某双前轴重型车辆的转向机构进行了分析和设计匹配,综合考虑了机构干涉和转向机性能参数以及转向平稳性,并运用了软件仿真校核转向结果,为今后类似

期刊

双前轴阿克曼转向杆

增白汤治疗抗甲状腺药物致白细胞减少症32例

应用增白汤治疗由抗甲状腺药物所致白细胞或粒细胞减少症 32例 ,疗效较为满意 ,第一疗程有效率为 62 .5% ,第二疗程为 96 .9% ,而且疗程越长 ,疗效越明显

期刊

甲状腺机能亢进症白细胞减少症增白汤

亚临床甲状腺功能减退对QT间期和心率变异性的影响

目的通过分析亚临床甲状腺功能减退（简称亚临床甲减）患者QT间期和心率变异性，探讨亚临床甲减对心脏电活动的影响。方法收集55例亚临床甲减患者为试验组，54例甲状腺功能正常者为对

期刊

亚临床甲状腺功能减退QT间期心率变异性心脏电活动

品位·品质·品牌——论大学出版社成长之路

<正> 大学出版社从80年代初相继创办以来,20年间走过了从创办到成长的历程。最近五年来,大学出版社已成为我国出版行业的重要的生力军,有些出版社已跻身全国先进出版社的行列

期刊

大学出版社出版者教学科研服务少儿读物图书选题成长之路学科优势

坐床

藏传佛教转世活佛升座继任的仪式。“床”指前一世活佛的法座，因法座又称为禅床，故将新一世的活佛到前世活佛的法座上就坐、正式继承前一世活佛的学佛修行和传法事业以及政治宗

期刊

藏传佛教宗教地位活佛仪式“床”转世修行学佛

河北省能源消费与碳排放影响因素分析

选取1980~2011年的样本数据,应用IPCC碳排放计算方法对河北省能源消费碳排放及经济发展进行阶段分析,同时利用LMDI模型对碳排放增量进行影响因素分解,分析人口、经济产出、产

期刊

能源消费碳排放河北省LMDI

残差策略网络在计算机围棋的应用研究

与本文相关的学术论文