论文部分内容阅读
Pac-Man是一款风靡世界的追逐躲避类游戏,其中的非玩家角色(一般称为NPC,即Non-Player Character)Ghost是由脚本控制的,而脚本控制的NPC通常存在着行为单一的缺点。使用进化神经网络训练NPC使其行动灵活多变,得到自学习自适应的agent。目前关于Pac-Man的研究主要集中于如何使得Pac-Man具有更强的躲避能力,而对于NPC角色Ghost的研究还比较缺乏。Yannakakis曾使用进化神经网络来训练Ghost,但他的方法存在一些缺点。其一是训练得到的Ghost只有一种行动类型,表现不出原版中Ghost行为多样的特点;其二是他所使用的游戏场景过于简单,适应度函数、参数的选择设定不能适用于真实环境。针对以上问题,我们做了以下工作:首先,尊重原游戏中Ghost性格不同的设定,对需要训练的Ghost设计相应的适应度函数,单独训练,达到它们表现各异的效果;其次,通过使用WCCI2008的Pac-Man游戏引擎进行仿真,既恢复了原游戏的场景,又选择了合适的适应度函数、神经网络输入、参数来描述游戏进行过程,使得实验结果更有说服力;最后,通过设置惩罚项,解决了训练得到的Ghost行动范围小的问题。实验结果显示了进化神经网络学习的效果,说明了本研究所建立的方法是可行有效的。