基于A3C模型的带预判游戏智能体研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:a547189644
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,常见的游戏内置机器人在进行对抗时都是根据事先编写好的脚本进行决策,采取行动,而且可以获取利用一些不平等信息,并不是像人类玩家一样只根据游戏画面(或者再结合声音)进行分析决策,灵活多变。本课题主要研究深度学习和强化学习在游戏智能体领域的应用,以及相关算法的改进,使游戏智能体的决策过程更像人类,并使其摆脱对不公平信息的依赖。首先,本文采用VizDoom作为游戏智能体的研究平台,该游戏是一款第一人称视角的射击游戏。根据A3C算法设计实现了一个游戏智能体(即卷积神经网络),该智能体以原始的实时游戏画面作为网络输入,输出为对应的离散动作(即决策)。智能体会和VizDoom进行交互,读取实时游戏画面,然后进行决策,控制游戏中的角色行动。其次,本文对A3C算法做了一个改进,在其原有的基础上加入了一个预判网络,预判网络的目的是使智能体可以像人类玩家一样,在进行决策前做出一个预判,然后将实时游戏画面和预判画面一起作为A3C算法的网络输入,进行决策,输出对应的离散动作。由于这个改动仅仅改变了A3C算法的网络输入的数据结构,因此是一个模型无关的方法,易于移植到其他算法上。最后,本文分析比较了A3C算法和改进后的A3C算法在VizDoom上的表现差异,并且搜集了目前在该游戏平台上的相同游戏场景下的最新论文中的实验数据作为对照。实验结果表明,加入预判的A3C算法的表现要优于改进前的A3C算法。
其他文献
首先以空间系统的脆弱性、航天发射的成本和技术发展为切入点,阐述了发展航天快速发射的必要性,剖析了航天快速发射的现实需求;其次以自然灾害、局部战争为例,论证了在突发事
2010年9月26日,由中国魏晋南北朝史学会与襄樊市人民政府联合举办,襄樊学院承办的“中国三国历史文化国际学术讨论会”在襄樊学院隆重召开。出席会议的代表有中国魏晋 On Se
<正>《环球时报》1月9日刊登中国社会科学院专家陈承新的文章说,2020年伊始,众多西方国家领导人在新年贺词中赞扬和强调年轻一代的作用。确实,在过去的一年中,年轻一代群体频
实现科技人员“常下乡”“常在乡”$$科技部副部长 侯建国$$科技部高度重视“三下乡”活动。从2001年开始,在中宣部牵头组织下,面向广大农民普及科技知识,开展科技惠农服务,有力
报纸
我们计算机系基础实验室担负全院非计算机专业的计算机上机任务,对于我们这样具有百台微机规模的机房,如果条件允许,应建一个小型局域网,以方便软件的安装与管理。但是如果不能建
<正>天然橡胶尽管在物理性质方面优于合成橡胶,但由于它的耐油、耐气候性较差,所以日本在60年代,辊筒原材料主要采用合成橡胶。目前日本所生产的合成橡胶约有16种,其中用在染
目的 观察MMTV Wnt 1转基因小鼠的乳腺癌发病情况及病理学变化规律。方法 观察MMTV Wnt 1转基因小鼠肿瘤发生情况 ,并采用原位移植将瘤组织置于裸鼠皮下 ,通过组织病理学切
研究背景肺癌是世界上发病率和死亡率最高的的恶性肿瘤。据估计,全世界2018年将有大约154,050人死于该疾病。非小细胞肺癌(NSCLC)约占所有原发性肺癌的85%。近年来随着肿瘤的靶向治疗和免疫治疗的发展,已经探索了治疗NSCLC的进展途径,靶向药物和免疫治疗药物为一些NSCLC患者带来了新的希望。然而,5年生存率(约18%)仍然非常低。因此,有必要确定新的和更有效的NSCLC治疗靶点。肿瘤坏死
目的探讨腹腔镜下全直肠系膜切除(TME)基础上采用内括约肌切除保肛术治疗低位直肠癌的可行性和初步结果。方法 2007-04~2008-06对36例低位直肠癌患者经腹腔镜实施内括约肌切除保
小说自身的规律是中国古典小说发展的根据和内因,社会的政治、经济和文化因素是小说发展的条件和外因。中国古典小说的历史发展,从宏观上看,是自身的规律所划出的主航道奔腾向前