【摘 要】
:
当前游戏中非玩家角色(Non-player Character,NPC)的行为主要基于随机决策或者传统的预定义行为决策,该方法的NPC不具有对游戏环境的自主学习能力.本文研究的目的是探索将强化
【机 构】
:
四川大学计算机学院,四川民族学院计算机学院
【基金项目】
:
四川省科技支撑项目(2013GZX0138,2012GZ0091)
论文部分内容阅读
当前游戏中非玩家角色(Non-player Character,NPC)的行为主要基于随机决策或者传统的预定义行为决策,该方法的NPC不具有对游戏环境的自主学习能力.本文研究的目的是探索将强化学习方法应用于提高游戏NPC智能,使NPC在游戏过程中能实时地学习和适应演进的游戏环境,产生最合适的行为策略来响应玩家.本文提出一种动态训练强化学习的探索率参数方法,并将该方法应用于经典的Bomber Man游戏中.实验结果表明,该方法训练的NPC比非强化学习和传统强化学习训练的NPC具有更高的智能.
其他文献
在1/1000质量浓度的多效唑(PP333)作用的水涝环境下测定麻疯树幼苗平均叶面积无明显增加并有较高的根冠比,单水涝胁迫下的根冠比先升高后降低,无胁迫组则始终呈下降趋势与预期
本实验建立了高效液相色谱法测定,浊点萃取,以表面活性剂TritonX-100提取苦荞茶中的牡荆素,芦丁和槲皮素的方法.色谱柱为PhenomenexC18(250mm×4.6mm,5μm);流动相为甲醇一0.6%醋酸
我们利用简单的相界面法自组装出一系列卟啉的微纳米结构,包括纳米棒、纳米管和纳米粒子,借助扫描电镜(SEM),红外谱(IR)和X衍射仪(XRD)对其形貌和结构进行了表征,并考察了不同卟啉微纳
以共面波导结构和人工神经网络为基础实现了一种宽带溶液介电常数测量.由于共面波导在自由空间中辐射小、结构灵敏等优点,本文通过时域有限差分法算法在1-3GHz下优化设计了一
本文对Rosenau-RLW方程的初边值问题进行了数值研究,提出了一个隐式拟紧致C-N差分格式,该格式很好地模拟了问题的守恒性质.通过Brouwer不动点定理,本文得到了差分解的存在性,给出了
为了分析Cr,Tm,Ho:YAG激光器(以下简称CTH:YAG)系统中各种离子受激跃迁时的温度特性,从CTH:YAG激光器的适配激光速率方程出发,针对准三能级特性及Tm Ho准热平衡体系特点,提出了反
摘要:运用不动点指数理论,作者研究了带参数的分数阶微分方程边值问题{D0a+u(t)=λf(t,u(t)),0〈t〈1,u(0)=u(1)=0,u′(0)=u′(1)=0多个正解的存在性,这里λ〉0是一个参数,3〈a≤4是一个实数,D0a+
本文首先描述了仿射型单点扩张对应的Coxeter变换的特征多项式,其次研究了与del Pezzos曲面及Pn导出等价的quiver代数的Coxeter变换的特征多项式,最后刻画了相交矩阵的Coxete
采用溶胶-凝胶法合成了不同 Sm3+掺杂量、不同煅烧温度的 Sm3+/TiO2的光催化剂,并对所制得的光催化剂进行了系统的表征和光催化活性研究.XRD分析表明,所得粉体为锐钛矿相纳米Ti
金属纤维多孔材料是一类重要的吸声材料,采用驻波管法检测钛纤维多孔材料的空气声吸收系数,研究材料的孔隙度、纤维直径以及材料厚度等参数对吸声性能的影响,结果表明,钛纤维多孔