基于强化学习的非玩家角色行为改进

来源 :四川大学学报：自然科学版 | 被引量 : 0次 | 上传用户：out000

【摘要】

：

当前游戏中非玩家角色（Non-player Character,NPC）的行为主要基于随机决策或者传统的预定义行为决策,该方法的NPC不具有对游戏环境的自主学习能力.本文研究的目的是探索将强化

【作者】

：

李炎武陈渝曾庆维罗程林涛

【机构】

：

四川大学计算机学院,四川民族学院计算机学院

【出处】

：

四川大学学报：自然科学版

【发表日期】

：

2014年5期

【关键词】

：

游戏智能强化学习非玩家角色 Game intelligence Reinforcement learning NPC

【基金项目】

：

四川省科技支撑项目（2013GZX0138,2012GZ0091）

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

当前游戏中非玩家角色（Non-player Character,NPC）的行为主要基于随机决策或者传统的预定义行为决策,该方法的NPC不具有对游戏环境的自主学习能力.本文研究的目的是探索将强化学习方法应用于提高游戏NPC智能,使NPC在游戏过程中能实时地学习和适应演进的游戏环境,产生最合适的行为策略来响应玩家.本文提出一种动态训练强化学习的探索率参数方法,并将该方法应用于经典的Bomber Man游戏中.实验结果表明,该方法训练的NPC比非强化学习和传统强化学习训练的NPC具有更高的智能.

其他文献

多效唑对水涝胁迫下麻疯树幼苗生理指标的影响

在1/1000质量浓度的多效唑（PP333）作用的水涝环境下测定麻疯树幼苗平均叶面积无明显增加并有较高的根冠比,单水涝胁迫下的根冠比先升高后降低,无胁迫组则始终呈下降趋势与预期

期刊

水涝胁迫麻疯树幼苗生理指标多效唑PP333酶活Water logging stress Jatropha curcas seedlings P

浊点萃取高效液相色谱法测定苦荞茶中的黄酮

本实验建立了高效液相色谱法测定，浊点萃取，以表面活性剂TritonX-100提取苦荞茶中的牡荆素，芦丁和槲皮素的方法．色谱柱为PhenomenexC18（250mm×4．6mm，5μm）；流动相为甲醇一0．6％醋酸

期刊

浊点萃取牡荆素芦丁槲皮素TRITONX-100苦荞茶Cloud point extraction Vitexin Rutin and quercet

相界面法合成卟啉微纳米结构及其光学性质

我们利用简单的相界面法自组装出一系列卟啉的微纳米结构，包括纳米棒、纳米管和纳米粒子，借助扫描电镜（SEM），红外谱（IR）和X衍射仪（XRD）对其形貌和结构进行了表征，并考察了不同卟啉微纳

期刊

卟啉化合物微纳米结构光学性质Porphyrin Micro- and nano-structures Optical properties

一种基于神经网络算法的宽带溶液介电常数测量

以共面波导结构和人工神经网络为基础实现了一种宽带溶液介电常数测量.由于共面波导在自由空间中辐射小、结构灵敏等优点,本文通过时域有限差分法算法在1-3GHz下优化设计了一

期刊

介电常数宽带测量神经网络共面波导Complex permittivity Broadband measurement Artificial neur

Rosenau－RLW方程的拟紧致C－N守恒差分格式

本文对Rosenau－RLW方程的初边值问题进行了数值研究，提出了一个隐式拟紧致C－N差分格式，该格式很好地模拟了问题的守恒性质．通过Brouwer不动点定理，本文得到了差分解的存在性，给出了

期刊

Rosenau-RLW方程C-N守恒格式存在性收敛性稳定性唯一性Rosenau-RLW equation C-N conservative sch

CTH：YAG激光器Tm-Ho准热平衡体系反转跃迁因子的数值模拟分析

为了分析Cr,Tm,Ho：YAG激光器（以下简称CTH：YAG）系统中各种离子受激跃迁时的温度特性,从CTH：YAG激光器的适配激光速率方程出发,针对准三能级特性及Tm Ho准热平衡体系特点,提出了反

期刊

固体激光器Tm-Ho准热平衡体系数值模拟激光速率方程stark能级Solid-state laser Tm-Ho quasi-thermal equ

一类带参数的分数阶微分方程边值问题多个正解的存在性

摘要：运用不动点指数理论，作者研究了带参数的分数阶微分方程边值问题{D0a＋u（t）=λf（t,u（t））,0〈t〈1,u（0）=u（1）=0,u′（0）=u′（1）=0多个正解的存在性，这里λ〉0是一个参数，3〈a≤4是一个实数，D0a＋

期刊

分数阶微分方程正解锥不动点指数fractional differential equation positive solution cone fi

Coxeter变换的特征多项式

本文首先描述了仿射型单点扩张对应的Coxeter变换的特征多项式,其次研究了与del Pezzos曲面及Pn导出等价的quiver代数的Coxeter变换的特征多项式,最后刻画了相交矩阵的Coxete

期刊

Coxeter变换标准仿射化矩阵DELPezzos曲面Coxeter transformation standard affine matrix d

Sm3＋/TiO2光催化剂降解酸性品红实验研究

采用溶胶-凝胶法合成了不同 Sm3＋掺杂量、不同煅烧温度的 Sm3＋/TiO2的光催化剂,并对所制得的光催化剂进行了系统的表征和光催化活性研究.XRD分析表明,所得粉体为锐钛矿相纳米Ti

期刊

光催化剂助催化剂稀土掺杂形成机理PhotocatalystCocatalystRare earth dopedFormation mechanis

钛纤维多孔材料孔径分布与吸声性能研究

金属纤维多孔材料是一类重要的吸声材料，采用驻波管法检测钛纤维多孔材料的空气声吸收系数，研究材料的孔隙度、纤维直径以及材料厚度等参数对吸声性能的影响，结果表明，钛纤维多孔

期刊

钛纤维多孔材料孔径吸声材料Titanium fiber porous material Aperture Sound-absorbing materi

基于强化学习的非玩家角色行为改进

与本文相关的学术论文