深度强化学习综述:兼论计算机围棋的发展

来源 :控制理论与应用 | 被引量 : 0次 | 上传用户:feiwu111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度强化学习将深度学习的感知能力和强化学习的决策能力相结合,可以直接根据输入的图像进行控制,是一种更接近人类思维方式的人工智能方法.自提出以来,深度强化学习在理论和应用方面均取得了显著的成果.尤其是谷歌深智(Deep Mind)团队基于深度强化学习方法研发的计算机围棋"初弈号–Alpha Go",在2016年3月以4:1的大比分战胜了世界围棋顶级选手李世石(Lee Sedol),成为人工智能历史上一个新里程碑.为此,本文综述深度强化学习的发展历程,兼论计算机围棋的历史,分析算法特性,探讨未来的发展趋势和应用前景,期望能为控制理论与应用新方向的发展提供有价值的参考.
其他文献
中国古典舞有着悠久的历史,是中国的传统文化之一。如何将中国古典舞与当前的社会潮流趋势及当代的审美结合在一起并让人们自发地将其传承下去成为了一个值得深思的问题。
<正>初中语文课例研究,不同于语文课例。课例是一节节具体的课,课例研究是要弄清一节课为什么这样上而不那样上。例如:如何处理教材、设计教学方案才能体现新课标教学理念?课
<正>供应商是我军采购建设中的重要内容之一。新时期下如何更好地加强对供应商的管理值得我们研究。随着互联网的广泛传播,"大数据"的概念越来越被人们所熟知。通过大数据的
利用混合有限元方法将高阶方程降阶,然后利用空间连续而时间允许间断的时空有限元方法离散低阶方程,构造了四阶抛物方程的间断时空混合有限元格式,证明其离散解的稳定性和收
1976~1992年,主要用生化遗传方法并辅之以形态学资料,共分析了中国近海的1 400余尾带鱼的样品。生化遗传资料分析了11种同工酶,共记录出24个基因座位,其中4种酶9个基因座位具
基层林业站在现代林业发展过程中扮演着重要角色,其对于林区经济结构调节、林区建设相关的法律法规宣传均有着重要作用,同时基层林业站是林业发展过程中的管理服务组织,因此
睡眠是优秀运动员在训练或比赛期间达到身体快速恢复,消除疲劳的重要方式,可以有效促进运动员身体机能的恢复和竞技状态的良好发挥。研究运动员的睡眠时长和质量是为了更好地在训练或比赛期间为教练的指导训练和赛时的场上人员安排提供一定的理论依据和量化指导。也可以更好地了解运动员的整体睡眠质量和竞技状态之间的关系,根据睡眠检测结果有针对性的为每个运动员改善睡眠质量做出有效调整。研究目的:本研究旨在通过对运动员的
对文蛤(Meretrix meretrix L.,1758)、青蛤(Cyclina sinensis G.,1791)、硬壳蛤(Mercenaria mercenaria L.,1758)、江户布目蛤(Protothaca jedoensis L.,1874)、薄片镜蛤(Dos
<正> 八十年代的我国图书情报学学术界处于一个相当活跃而又成果累累的时期。大量的期刊论文及数本译著和专著相继问世。人们开始在丰富的经验知识积累的基础上,在大量引进吸
<正>移动互联网时代,表面上是技术的革新,实质是用户生活方式的变革。移动互联对媒体提出的要求绝不仅仅是形式上的变化,每个媒体都应该根据移动化的媒体形态改变自身内容的