机器博弈主要技术分析

来源 :电脑知识与技术 | 被引量 : 0次 | 上传用户:game00vergoo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:该文针对机器博弈中常见的技术和各种优化方法以六于棋为例进行分析和讨论,从棋盘表示、走法生成、博弈树与搜索算法这三个方面进行展开,从各种技术的优缺点出发,为机器博弈新思路提供了参考。
  关键词:机器博弈;六子棋;博弈树;搜索算法;蒙特卡罗树;剪枝
  中图分类号:TP391 文献标识码:A
  文章编号:1009-3044(2019)33-0172-02
  机器博弈是人工智能领域最富挑战性的项目之一,而六子棋作为一种典型的博弈类竞技游戏,相比五子棋黑棋先手必胜的单调不公平性,其公平性到目前为止还不能被证伪,其状态空间大小(约为10172)为五子棋(约为10105)的1072倍,搜索结点数大大增加,极具挑战性。因此,以六子棋作为研究机器博弈的切人点既能促进六子棋的发展,同时也可推动机器博弈乃至人工智能领域的进步。
  六子棋的棋盘大小为19行19列,其规则为:黑棋先手一子,以后白黑轮流落二子,在纵、横、斜任意一条直线上先连成六子(或六子以上)者获胜。如下满棋盘仍未分出输赢则判为平局。
  占用空间同二维数组,但如能利用某种方法提取待搜索的特征信息作为模式串,便可借助模式匹配算法,把递归搜索转换成线性匹配,提高效率。
  1.3位棋盘(Bit Boards)
  为提高运算速度、减少存储空间,常采用位棋盘的方式来表示数据,在六子棋中,棋盘上只可能出现:空、黑子、白子这三种情况,使用二进制表示至少需要2位。棋盘上每行共19个点,需要至少38位,考虑使用一个长整型(占8个字节共64位)则整个棋盘需要19*8B,共152B。利用位进行存储,可以使用逻辑运算来处理问题,其效率远高于其他运算。
  2走法生成
  走法生成即将下一步落子的所有合法位置枚举出来。枚举走法的过程往往依赖搜索,因此一个好的走法生成策略是博弈系统效率提升的关键。常见的走法生成策略有:预置表、棋盘扫描、Null-Move启发(空着启发)以及它们的结合等。预置表:存储所有可行的走法,生成走法时直接查表,优点即速度快,缺点即局限于规则较多且走法有限的棋类。棋盘扫描:即按照规则对棋盘区域进行遍历,确定落子位置。Null-Move启发(空着启发):假设一方先不动,让另一方多落子一轮,然后搜索动方获胜的迫著序列,此时对于不动方来说只需重点防范这个序列,产生的防范区域称为R-Zone,不动方便只需在R-Zone中生成走法,大大减少了搜索空间,提高了搜索效率,缺点即工于防范而疏于进攻,难以获胜乃至防不胜防而落败,因此空着启发常常与其他算法结合使用。
  3博弈树与搜索算法
  博弈树即对博弈局面及其未来可能性的抽象。就六子棋而言,博弈双方轮流交替回合,这种情况能够抽象成一颗与或树。“与”指我方需要考虑所有的走法,走法之间是与的关系,或表示对方可能选择众多走法中的任意一种。其中交替表现在树中偶数层结点为我方(黑子),奇数层为对方。
  在建立博弈树的过程中评估函数需要对每个结点评估。所谓评分就是给当前棋局打分,對我方越有利分数越高,反之分数越低。搜索则是遍历博弈树的过程,目前来说,几乎所有的搜索算法都基于极大极小值思想。
  3.1极大极小值算法
  在与或博弈树的基础上,假设一方为我方,则在搜索的过程中我方回合时总是选择评分最高的结点,而轮到对方时,总是选择评分最低的结点。
  3.2 Alpha-Beta剪枝
  极大极小值算法在搜索的过程需要完整遍历博弈树的每个结点,然而有很多结点不会对局面产生贡献,如果能够去掉对这些无用结点的遍历,算法的效率就能够得到极大的提升,这也是一系列改进算法的着手点。对于Mpha-Beta算法来说,它通过改变搜索的上下界来缩小搜索空间,即所谓的剪枝。
  3.3 MCTS树搜索
  大名鼎鼎的MphaGoZero也是基于该算法,MCTS即蒙特卡罗树搜索。虽然同样通过剪枝来缩小搜索空间,与Mpha-Beta不同的是,它对结点的评判依据不是人为构造的评估函数,而是蒙特卡罗模拟,所以随着搜索深度增加,越接近最优解,收敛较快。尤其适合应用于分支较多的搜索问题。该搜索算法主要有四个部分:选择、扩展、模拟以及回溯更新。
  选择阶段,从起点开始递归地对评价最高的结点进行搜索,评价一般采用UCT策略,该策略在搜索时采用UCB算法(Upper Confidence Bounds置信区间上界)其思想是:先对起点所有的子结点都搜索一遍,按照公式③计算每个结点的分数,然后选择分数高的继续搜索。
  s指当前结点,p表示父结点Score,表示当前结点的分数,p(s)表示当前结点的累计分数,N表示结点的访问次数,c是一个自定常数。
  扩展阶段,选中一个结点对其进行扩展子节点。
  模拟阶段,根据蒙特卡罗模拟方法对拓展出的子节点进行模拟,即随机选择一个可落子位置作为其子节点,然后子节点继续模拟,直到博弈结束。
  更新阶段,将子结点的得分累加到其父节点,不断从下向上累加更新。
  4结束语
  限于版面以及评估函数的差异性,本文没有详细讨论评估函数部分。机器博弈所涉及的领域较多,作者仅以所了解进行讨论,希望能给读者一点收获。
其他文献
摘要:在《通信技术基础》的教学中,利用SystemView仿真软件强大的运算、频谱分析、滤波等功能,能直观形象的仿真信号在各个通信设备中传输的波形和频谱变化,且通过理解设备的具体功能,从而提高学习通信基本原理的效率。该文以BPSK作为系统调制解调技术,采用SystemView设计了语音通信系统基本拓扑结构和数据配置。通过观察过程中输入与输出波形之间的前后差异,分析本次设计系统的传输质量和安全性能。
摘要:随着互联网技术的进步,信息化的高速发展带动我们生活的方方面面,在信息技术的支持下,人们利用大数据对交通进行了全面的升级换代,利用更加科学的管理手段对交通的方方面面进行更新,一个新的智慧交通网正在被构建,人们的生活正在被极大地改善。  关键词:智慧交通模式;信息数据;车载数据接收  中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2018)13-0016-02  智慧城市
摘要:借助网络优势发展乡村旅游业。以海南国际旅游岛建设为例,构建乡村旅游网络营销模式,宣传乡村旅游产品,建构良性发展的乡村旅游模式,搭建良好的网络营销平台。通过乡村旅游业,促进中国乡村建设,使之成为文明乡村、生态乡村、卫生乡村、美丽乡村、绿色乡村和环保乡村。让海南真正变为人间天堂。  关键词:网络;乡村旅游;营销模式;海南  中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2
摘要:碎片化移动学习是当前比较热门的一种学习方式,特别是远程教育的学生,面对工学矛盾的情况下,除了通过传统模式下获取的学习资源外,可以灵活使用多种媒体工具进行随时随地的移动学习。而移动学习中最核心的要素就是学习资源,目前比较常见的基于碎片化移动学习的资源就是微课程,如何进行微课程教学内容的设计显得尤为重要。该文以具体课程为例,从三个方面论述了基于碎片化移动学习的微课程教学设计 。  关键词:碎片化
摘要:随着科技的发展,特别是无线传感器网络、嵌入式以及移动互联网技术的发展,物联网应用开发逐渐发展成为一门全新的综合性课程。然而对于这一新型的课程,现阶段实践教学中存在着一些薄弱环节。本文通过对都柏林科技大学实践教学模式的解读,从中获得启示,对国内应用型高等学校的物联网应用开发课程实践教学模式进行研究,针对物联网应用开发课程的特点,在实践教学模式和评价体系方面提出探索性思考。  关键词:实践教学;
摘要:随着大数据时代的到来,大数据思维成为职业学校学生教育中的重要部分。在《Excel中的图表与美化》教学过程中,以光明日报社联合腾讯公司和京东集团推出首款大数据《从阅读指数看城市气质》为情境,让学生通过对数据的处理,建立图表,从而发现数据之间存在的关系,挖掘出数据新的价值,体现了大数据思维,也培养了学生整理数据、处理数据和分析数据三个层次的能力。  关键词:大数据思维;《Excel中的图表与美化
摘要:文章探讨了在《复变函数与积分变换》课程教学中实施基于慕课的混合式教学模式的必要性。针对课程教学现状和存在的问题,利用慕课化网络教学平台,从在线活动、课堂活动和教学评价三方面进行模式构建,探索开放在线课程和传统教学课程相结合的教学模式,以推进《复变函数与积分变换》课程教学改革。  关键词:《复变函数与积分变换》课程;慕课;混合式教学  中图分类号:G642 文献标识码:A  文章编号:100
摘要:2018年,教育部发布《教育信息化2.0行动计划》,并在全国推动该计划的落地生根。成都市万春小学是一所位于城乡结合部的小规模薄弱学校。为了推动落实《教育信息化2.0行动计划》,我们从学习方式、课程系统、空间布局、信息管理和提升教师信息素养等多方面进行了实践和探索,以期找到符合学校教育信息化发展实际的有效路径。  关键词:教育信息化2.0;校本实践;信息素养;发展历程  中图分类号:G642
摘要:微课程设计模式为高职微课程开发提供了系统化的理论依据。以高职《C#程序设计》微课程开发为例,通过课程分析,系统化地划分了课程主题和知识点,以“for语句”知识点为例,从教学活动设计(微教案设计、微教学资源设计)、学习活动设计(微学案设计、微学习资源设计)、评价活动设计(微反思设计、微反馈设计)等方面对微课程设计模式进行实践研究,为高职微课程开发提供实践经验。  关键词:高职;微课程;设计;实
摘要:文化创意产业的大发展和大繁荣已经成为当前社会飞速发展、创新转型的重要标志,越来越多的国际化城市都在通过大力发展文化创意产业促进城市内涵提升和城市品牌打造。该文指出,成都要发展成为中国西部最有影响力和竞争力的国际化大都市,应着力打造富有个性的文化创意产业,藉以丰富城市文化内涵、提升城市文化形象、助推城市文化发展。而文化创意产业服务平台建设对文化创意产业发展起着重要的信息枢纽和资源整合的作用。本