残差策略网络在计算机围棋的应用研究

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:seanzhow
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
虽然近年来人工智能技术在各个领域中迅速发展,但是围棋因其自身的复杂度一直以来都是人工智能领域中的难解之题,一直到两三年前,国际学术界仍普遍认为真正解决围棋问题至少需要10到20年的时间。为了解决这一问题,DeepMind公司设计的AlphaGo计算机围棋将卷积神经网络带入到计算机围棋的问题中,通过该方法AlphaGo战胜了代表围棋职业棋手顶尖水平的李世石九段与柯杰九段,宣告了人类真正在人工智能领域上解决了围棋问题,而如何进一步提高计算机围棋棋力成为学者们继续探索的方向。提高计算机围棋棋力的主要方法是提高计算机围棋中卷积神经网络的正确率,但是随着网络层数加深,卷积神经网络会因为网络过于复杂出现过拟合的情况。前微软研究员何凯明法发明的深度残差网络有效的解决了这一问题,深度残差网络可以极大的增强深度学习网络的表达能力,使其能够轻松的训练高达150层的网络,从而实现网络精度的提高。本文在研究AlphaGo中策略网络模型的基础上,设计了策略网络与深度残差网络相结合的残差策略网络,从而实现计算机围棋棋力的提高。本文首先对AlphaGo中的策略网络模型以及深度残差网络的基本原理进行了研究。其次根据策略网络的要求进行数据收集、整理以及处理的工作,并根据这些数据复现了 AlphaGo的策略网络。之后本在此基础上本文完成了对残差策略网络的数据,并使用相同数据对残差策略网络进行了实现与训练。最终经过实验比较发现,残差策略网络与比原始的策略网络相比具有更高的精度,可以有效的提高计算机围棋的棋力。
其他文献
在机器学习和数据挖掘中,带约束的半监督聚类是一个活跃的研究领域。为了利用约束条件获得表现更优异的聚类效果,提出了一种成对约束的属性加权半监督聚类算法,该方法充分考
We report on the properties of strong pulses from PSR B0656+14 by analyzing the data obtained using the Urumqi 25-m radio telescope at 1540 MHz from August 2007
日前,山南市金融精准扶贫产业试点县暨金融电商惠民服务站授牌仪式在扎囊县隆重举行。据悉,首个金融电商惠民服务站除了办理传统的助农取款业务外,还新增加人民币兑残换零、金融
许多商品是需要包装的。包装最直接的功能是延长其保质期,或使之便于运输、携带且不受污染、损害。除了这些实用功能外,被包装的商品属性还催生了包装的非实用性功能:以包装增
本文以阿克曼原理为基础,对某双前轴重型车辆的转向机构进行了分析和设计匹配,综合考虑了机构干涉和转向机性能参数以及转向平稳性,并运用了软件仿真校核转向结果,为今后类似
应用增白汤治疗由抗甲状腺药物所致白细胞或粒细胞减少症 32例 ,疗效较为满意 ,第一疗程有效率为 62 .5% ,第二疗程为 96 .9% ,而且疗程越长 ,疗效越明显
目的通过分析亚临床甲状腺功能减退(简称亚临床甲减)患者QT间期和心率变异性,探讨亚临床甲减对心脏电活动的影响。方法收集55例亚临床甲减患者为试验组,54例甲状腺功能正常者为对
<正> 大学出版社从80年代初相继创办以来,20年间走过了从创办到成长的历程。最近五年来,大学出版社已成为我国出版行业的重要的生力军,有些出版社已跻身全国先进出版社的行列
藏传佛教转世活佛升座继任的仪式。“床”指前一世活佛的法座,因法座又称为禅床,故将新一世的活佛到前世活佛的法座上就坐、正式继承前一世活佛的学佛修行和传法事业以及政治宗
选取1980~2011年的样本数据,应用IPCC碳排放计算方法对河北省能源消费碳排放及经济发展进行阶段分析,同时利用LMDI模型对碳排放增量进行影响因素分解,分析人口、经济产出、产