二打一智力游戏中残局局面数据标定方法研究

来源 :重庆理工大学学报(自然科学版) | 被引量 : 0次 | 上传用户:goodgay3_2004
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于深度学习模型的有监督训练依赖于大量高质量标定数据,针对非完全信息博弈中二打一智力游戏问题,根据不同阶段回合局面数据的特点,提出了通过Alpha-Beta完全搜索获得共包含400万带标定二打一智力游戏局面样本的数据集,根据得到的标定样本训练CNN模型,使其能够对二打一智力游戏残局进行局面评估,为进一步将牌类游戏向棋类游戏的转化提供了保障,也为其他非完全信息博弈训练数据的标定提供了有价值的借鉴.
其他文献
利用现有的轴承压装翻边模具压装生产后的飞机零件,无法达到所要求的各项性能和指标.针对现阶段所存在的问题,采用ABAQUS软件对整个翻边过程进行动态仿真,反复修改模具结构和
通过减弱或改变作战飞机的红外辐射特征,使其温度与环境温度接近,从而达到降低使其被发现的概率,本文在某型发动机排气系统目前技术状态的基础上设计了不同宽高比、不同喷管
会议
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
11月25日午夜,古巴领导人劳尔·卡斯特罗发表全国电视讲话,宣布古巴革命领袖菲德尔·卡斯特罗逝世,享年90岁。菲德尔·卡斯特罗,1926年8月13日出生于古巴东方省比兰镇。他195
本文通过对某机型飞机通信控制器话音告警模块原理的阐述,对其在地面进行整机调试过程中出现误告警问题进行了认真的分析和研究后最终确定了解决问题的方案。通过对系统工作
会议
MBD是飞机研制数字化技术发展的新阶段和总趋势,采用MBD技术体系为航空工业带来管理上和效率上的飞跃,其以集成的三维数字化模型替代二维工程图纸作为唯一制造依据,在协同并
机载有源相控阵(AESA)雷达较传统的机械式扫描雷达最大的特点是波束捷变特性,这种特性是由波束控制系统来实现的.波束控制系统在不同的相控阵雷达中具有不同的构架,它们主要
现阶段飞行程序保护区的设计基于AutoCAD软件实现,虽然弥补了手绘阶段周期长的不足,但是仍然存在低效、可视化程度较低等缺点.随着当前地理信息技术和计算机仿真技术的发展,
会议
针对全国竞技二打一扑克锦标赛中如何保证比赛的公平、公正性,降低冗长的比赛赛程问题,提出通过给出具有较高区分度的初始手牌用于比赛发牌阶段以减少比赛轮次的解决方案,并
通过对国外女飞行员出现的过程和防护救生装备的发展状况的介绍,并以美国女飞行员的防护救生装备为例,说明女性飞行员防护救生装备在研制上的特殊性.在此基础上结合我国女飞