麻将机器博弈方法研究

来源 :沈阳航空航天大学 | 被引量 : 0次 | 上传用户:ma_mwj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着AlphaGo等智能体在完备信息博弈领域取得的重大突破,非完备信息博弈研究越来越受到关注,麻将是其中非常典型的多人牌类项目。麻将因其复杂的规则和丰富的隐藏信息,难以建立基于规则的有效博弈树,无法直接将大多数传统的算法进行应用,并且目前国内麻将缺乏统一平台和大量专家牌谱数据,难以设计出基于监督学习的博弈算法。针对以上问题,本文开展了递进式的研究,主要研究工作如下:首先,针对内陆麻将完善了麻将AI的知识体系。根据先验知识对麻将博弈的弃牌模块划分了4个优先级(共计23层);对吃牌模块构建了吃牌优先级;对听牌模块提出了“听牌有效数”的方法;对碰牌、杠牌和胡牌模块进行了特殊牌型的处理。其次,针对麻将多智能体博弈场景和点炮让己方收益最小化的问题,提出了通过对听牌对手的手牌进行随机模拟来降低点炮概率的方法。在完善知识体系的基础上,应用蒙特卡洛方法对听牌状态的对手的手牌进行模拟。通过模拟生成的10种听牌手牌,模拟轮流打出手牌中每一张牌,计算每张牌的点炮次数,选择次数最小的牌做弃牌处理,有效降低了点炮概率。再次,对内陆麻将开展了深度强化学习视角的研究。设计了4个随机出牌的AI进行对弈,以其中一个AI的视角收集牌谱,调用神经网络进行迭代训练,每一轮训练好的模型在下一轮中会被使用并加强训练。最后,在个人平台上实现了麻将的博弈框架,通过两部分共五组对比实验,分别验证了知识体系中具体策略的效果和深度强化学习模型AI的博弈水平。
其他文献
液压支架作为巷道超前支护的重要设备,对保障巷道稳定性起着至关重要的作用。普通液压支架在冲击载荷作用下表现为刚性支护,抗冲击能力差。因此设计可以起到让位吸能作用的吸能防冲构件来提高液压支架防冲性能是十分必要的。本文以巷道超前支护ZHD4150型门式液压支架为设计对象,基于构件能量吸收主要集中于角单元部分的考虑,设计了与液压立柱结合使用的凹角圆管式和多胞圆管式吸能构件。通过数值模拟分析了不同参数对凹角
学位
为了实现内外侧壁均为直壁且内外侧间距狭小的直壁件的数控渐进成形,本文提出了一种基于模型分区与平缓面的板料姿态多方位调整的数控渐进成形方法。该方法是首先对直壁件模型进行分区,并以此建立更加平缓的平缓面(是指相对于直壁成形角较小的平面);然后借助于平缓面,调整板材姿态,进而减小直壁的成形角;最后按所确定的板料姿态,以板料面平行下移进行成形,进而确保直壁的无破裂成形。同时,研究了直壁件模型分区、平缓面生
学位
球形磨头铣磨加工方法对于航空航天领域内一些具有复杂曲面、型腔、加工空间有限的零件磨削有较好的适用性。研究球形磨头铣磨加工力学模型与铣磨加工质量,可为推动球形磨头铣磨加工方法的工程应用提供理论支撑与实验基础。本文结合理论分析、有限元仿真与铣磨加工实验对球形磨头铣磨加工力学模型和铣磨加工质量进行了研究,具体研究内容与结果如下:(1)以普通平面砂轮磨削力模型的建立过程为基础,分析了球形磨头铣磨加工中的磨
学位
近年来,航空航天领域发展迅速,技术更迭频繁。飞机框梁作为飞机上重要的主承力结构件,其生产制造过程也发生了重大的变化,整体增材制造技术在飞机框梁等大型结构件上应用广泛。本文主要以某型飞机整体框梁作为研究对象,对于其增材连接工装进行了设计,并制定了详细的装配工艺流程以及增材连接工艺策略。本文对某型飞机整体框梁增材连接工装的设计要求进行了分析,并根据整体框梁零件的结构特点,设计了用于框梁增材连接的工装。
学位
随着数据采集技术的不断发展,城市路况信息得以获得,人们出行开始更多的关注动态变化的出行时间而不再是距离,利用分段线性函数来刻画边权值随时间变化的动态路网(即时间依赖路网)得到了广泛关注。在网约车的应用场景中,为乘客找到能够最快到达其所在位置的多辆出租车具有实际意义。本文研究的就是动态路网中面向移动对象的近邻查询问题(Time-dependent k-Nearest Neighbor Query,T
学位
在飞机的设计研发过程中,依据飞机技术指标要求设计飞机的气动布局是飞机设计初期的首要任务。确定飞机整体参数的同时,需要提出若干气动布局方案。并且要通过较长的计算周期以及繁琐的计算步骤构建动力学模型,逐一对待选方案的全机气动特性进行分析、比较,筛选出气动特性达标的候选方案参与评审工作。为便捷地构建空气动力学模型,提高计算效率。本文以Bryan所提出的六自由度刚体运动方程为基础,根据获取的数据对飞机进行
学位
飞机辅助动力装置(简称APU)油管承受燃油流体冲击,进而引起油管和油管间连接部件的振动,造成油管螺母螺纹在服役期间造成诸多损伤,影响油管使用安全性及可靠性。油管结构损伤的进一步发展容易造成APU故障而失效,因此对油管结构进行研究,进而了解油管螺母螺纹损伤原因,对APU油管设计及APU检修有重要指导意义。首先基于油管结构的实际工况,利用ANASYS Workbench的Fluent模块进行流体仿真计
学位
近些年,随着卫星定位系统与移动蜂窝网络的不断优化升级,大量基于位置的服务软件得以迅速发展,伴随着智能移动终端设备的快速普及,使大规模采集和分析移动用户轨迹数据成为可能。用户的行为轨迹中可能包含敏感签到,而敏感签到中隐含用户的个人隐私信息,如果不加以处理直接进行发布,则会导致用户的个人隐私信息发生泄露,严重地将威胁到用户的财产损失与人身安全。因此,针对用户的隐私安全问题已经得到了国内外研究学者的广泛
学位
飞机辅助动力装置(简称APU)燃烧室作为APU最为重要的高温部件,由于长期处于恶劣的工作环境中,极易导致燃烧室在服役期间产生疲劳损伤问题,造成其使用安全性下降。因此通过对燃烧室进行损伤分析,获取部件的损伤区域,不仅有利于提高燃烧室检修效率,更可以为未来APU燃烧室的设计提供一定参考。本文通过理论分析、数值仿真以及结果验证比对的方法来分析燃烧室损伤区域。利用建模软件UG针对燃烧室建立等比例三维模型,
学位
面向考场监控视频的作弊行为检测对于减少监考的人力成本以及约束考生行为具有重要的价值。本文研究了基于骨骼的考生异常行为识别方法,主要工作内容如下。考场监控视频中考生的作弊动作较小并且隐蔽性强,本文针对该特点对考试过程中考生的作弊行为进行了分析,并构建了考场监控视频考生异常行为数据集EDT。采用基于骨骼的动作识别方法ST-GCN进行了分析。针对时空图卷积网络提取特征的过程中对特征在每个通道维度上具有相
学位