基于深度学习和重放数据的RTS游戏玩家获胜者预测

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:ok524500
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
游戏为人工智能(AI)算法提供了一种有用的研究和测试平台。利用深度学习算法对游戏中玩家获胜者的预测是AI规划的重要组成部分。实时战略(RTS)游戏是一类流行的实时战斗模拟游戏,由于巨大的状态空间,有限的决策时间和动态的对抗环境,RTS游戏为利用深度学习算法对游戏中玩家进行获胜者预测提供了理想的环境。游戏(特别是RTS类游戏)以及游戏玩家获胜者预测在军事作战仿真系统设计中有实际的应用。本文对RTS类游戏模拟器μRTS中具有不同搜索策略的RTS游戏AI机器人比赛生成的重放数据集和StarCraft Ⅱ的强化学习环境SC2LE提供的由匿名游戏玩家比赛生成的重放数据集设计编码方法。首先详细介绍了μRTS中的三组AI机器人的选择方法、重放数据集的生成方法,数据采样方法,利用独热编码对采样点的状态信息和动作信息的编码方法。详细介绍了对StarCraft Ⅱ的重放数据集进行预处理,然后分组成三种种族可进行的六种作战组合的过程,以及对每条预处理后的重放数据,运用PySC2解析出所有时间点下的动作信息和观测信息,从中筛选出有效时间点集合,提取出每个有效时间点下的空间特征并编码的过程。通过编码方法分别生成编码数据集。对RTS类游戏重放数据集利用设计的编码方法生成的编码数据集通过卷积神经网络(CNN)、多尺寸卷积神经网络(MSCNN)、条件神经过程(CNP)、长短期记忆(LSTM)和贝叶斯神经网络(BNN)对游戏玩家的获胜者进行预测。通过计算预测准确率、画出ROC曲线并计算相应的AUC值,以验证设计方法的预测性能,并对预测结果进行详细分析。实验结果显示,μRTS中的RTS游戏AI机器人生成的编码数据集使用五种深度学习算法进行获胜者预测的准确率约为0.8;StarCraft Ⅱ中匿名游戏玩家生成的编码数据集使用五种深度学习算法进行获胜者预测的准确率最高达到0.8。实验结果表明,利用设计的编码方法和深度学习算法,对RTS游戏玩家的获胜者预测是可行的,并具有较高的预测性能。本文研究结果说明RTS类游戏为研究AI模拟人类决策、探索搜索算法、数据分析、状态评估和宏观管理等提供了一种具体的适用平台。
其他文献
在新时代以建设海洋强国为发展战略的背景下,海洋文明的挖掘与海洋文化多样性的保护无疑成了重点议题。疍民,作为一支特殊的水上族群,对海洋的探索极大地丰富了中原文明之外的海洋想象,长期的海洋实践建构了疍民独特的族群文化,是我国海洋文明建设的重要力量。随着城市化的推进,居住于沿河海地区的疍民,其文化最先受到现代化与全球化的冲击,许多独特的海洋文化现象因失去发展的根基与土壤而遭到破坏,很大程度上削弱了海洋文
在多轮人机对话场景下,用户对话常存在指代或信息省略的问题,给对话系统准确识别用户意图造成了巨大困难。为此,研究者提出使用序列到序列模型,利用历史对话信息,将存在指代或信息省略的当前对话改写成完整且无歧义的对话。这类模型在对话改写中实际有两个任务:1)从历史对话中抽取能补全当前对话语义信息的文本。2)利用该文本辅助生成改写对话。通过对现有数据集的分析,本课题发现,历史对话中只有一小部分文本影响当前对
铝合金自然氧化膜耐蚀耐磨性较差,在室外极易遭到腐蚀,它的应用领域和服役寿命会受到很大程度的限制。因此增强铝及其合金的耐腐蚀性具有很大的经济价值和实用价值。超疏水表面在耐腐蚀等方面有广泛的应用,故在金属基体上构建超疏水表面可大大提高金属表面的耐蚀性。然而目前为止开发出的超疏水表面制备方法或工艺中,大多存在一定的不足,如工艺复杂、成本昂贵、不适合大面积基体表面等。这一方面制约着超疏水表面的大规模批量制
珠三角是我国人口最稠密、经济最发达的区域之一,高潮位变化会直接影响到航运、堤防安全、供水安全等诸多方面。准确了解和掌握珠江口高潮位的变化规律,以及高潮位的精确预报,对该区域的生产生活具有实用意义。本文研究珠江八大口门之中的横门、磨刀门从2001~2015年月平均高潮位的波动。分析月平均高潮位的变化规律及主要成分,同时研究当地气压、气温、风速、径流量、西太平洋水位等多种水文气象因子对珠江口月平均高潮
广州珠江外资建筑设计院(下文简称:珠江院)创建于中国改革开放之初的1979年,伴随着珠江之滨的白天鹅宾馆一起诞生,是广州市顺应“引进外资,探索建筑设计新模式,为建设高级旅游宾馆及大型公共设施场所”的潮流而成立的一家国企性质的综合建筑设计院。其前身脉络可追溯到60年代,广州市政府为满足旅游住宿增长需求而组建的“旅游设计组”。在这一特殊社会情况和历史背景下,珠江院成为计划经济与市场经济结合下诞生的设计
隧道可以克服复杂地形、优化高速公路路线走向,在高速公路工程中较为常见,其中浅埋偏压小净距隧道是一个典型的代表。新奥法是目前隧道施工常用的工艺,近年来施工监控量测技术发展迅速,也涌现了各类无损检测技术方案和仪器设备,如何确定行之有效的监控量测技术方案与大量实际工程的现实需求相结合,对于确保隧道施工安全和工程质量是至关重要的。本文以某高速公路的浅埋偏压小净距隧道为研究对象,通过理论数值模拟和现场监控量
铅黄铜作为一种传统的工程材料,因其具有良好的铸造性能、力学性能、耐蚀性能和切削性能,被广泛应用于电工电气、家用五金、仪器仪表和卫浴等诸多行业。然而,铅黄铜在使用过程中容易析出Pb元素,对环境和人体健康均有较大危害,因此研制新型的环保无铅硅黄铜成为了必然趋势。目前,针对无铅硅黄铜的切削性能研究主要集中在断屑性能和刀具磨损,对于无铅硅黄铜的动态力学性能及切屑变形-断裂机制的研究较少。本文以无铅硅黄铜为
随着无人机市场的规模不断扩大,无人机相关配件需求量也同步上涨,其中桨翼作为消耗品需求量尤其巨大。无人机桨翼上印有桨影图案,图案移印时可能会出现各种缺陷,现采用人工目视的方式检测缺陷,存在检测效率低、检测质量一致性差等问题。机器视觉检测系统虽然可以实现自动化检测、统一检测质量,但现有的机器视觉算法检测标准过于单一,难以复现人工检测的智能判断与综合决策,即根据不同缺陷客户接受度的不同采取不一样的检测标
视觉问答(Visual Question answer,VQA)的任务是根据给定图片和关于图片的自然语言问题,机器自动推理并输出答案。视觉问答是一项涉及到图像理解和语言处理两大研究领域的具有挑战性任务。视觉问答模型比较常用的是利用卷积神经网络(CNN)提取图像特征和循环神经网络(RNN)提问题文本特征,然后把这两特征映射到同一向量空间以预测答案。在视觉问答模型中主要需要三个相关技术:图像理解、问题
快速城市化背景下,一些基于原始农业系统的物质与非物质要素在城市发展吞并的大趋势下被保留下来,形成具有丰富“遗产”内涵的农业遗存,与城市绿地结合以协调城市建设与自然生态环境之间的巨大压力,然而,此类农业系统的生产属性与城市绿地管理、人群使用之间的矛盾,使得农业遗存既面临着适应高强度城市建设的环境压力,又面临着与城市绿地协同发展,共同建构良好城市生态人居环境的挑战。基于农业遗存生产属性与城市绿地相互影