基于改进优先经验重放算法的游戏控制研究

来源 :甘肃科学学报 | 被引量 : 0次 | 上传用户:xieshanxu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了使得高优先级被重放的概率进一步得到提升,并得到更重视最大优先级的函数表达式,对以往的研究中运用随机经验重放算法和一般的优先经验重放算法确定经验重放的优先级进行对比。通过改变优先级到概率的映射函数,利用小车爬山游戏模型表明改进优先经验重放算法可以使智能体快速的学习到最优的游戏策略,并可以大幅减少完成游戏所用的时间。结果表明新算法使游戏学习最优策略的速度提高了49.28%。
其他文献
什么是逆向思维大爷买西红柿挑了3个放到秤盘上,摊主秤了一下:“一斤半3块7。”大爷:“做汤不用那么多。”去掉了最大的西红柿。摊主:“一斤二两,3块。”正当我想提醒大爷注意秤时
提出仙客来良种的概念及引起良种退化的因素;提出解决退化的各种措施及比较完善的仙客来良种优势保持技术规范,并制定了仙客来良种的种质检验标准;继续深入地进行利用外源DNA片
针对甲醇装置燃气锅炉燃气压力波动大的现象,通过锅炉燃气压力及自力式减压阀工作原理的分析,对该阀门先后进行2次改造,使问题得到了解决,同时对自力式减压阀的使用提出了建
主要结合单频网组网技术的基本原理,详细分析了不同的单频组网方式:需要GPS的单频网组网、不需要每点都配置GPS的单频网组网以及传输流中的时间信息包(SIP),并对地面数字单频
中共中央党校原副校长李君如在3月29日的《北京日报》上撰文说,十七届四中全会对建设马克思主义学习型政党提了四个方面的要求:一是坚持科学理论武装,二是具有世界眼光,三是善
在日前举行的全国政策咨询工作会议上,国务院发展研究中心对外经济研究部部长隆国强在他的专题报告里强调:“后危机时代是战略机遇期里的黄金期。”我国应该像当年加入世界贸易
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
企业进行廉洁文化建设,其目的就是为了培育企业廉洁意识,养成企业廉洁管理、经营行为,它是促进企业反腐倡廉的重要组成部分。我国自从建党以来都十分地注重开展反腐倡廉工作,
上级组织部门的领导同志到下面当众作重要讲话或与干部个别谈话,大致有几种情况:一是宣布上级党委的重要决定,二是领导干部新老交接,三是主持领导干部评议、推荐,四是个别征求干部
为研究人工林生态系统土壤酶活性与活性氮周转的相互关系,以太行山南麓地区15 a侧柏人工林下土壤为研究对象,对比分析不同土层土壤转化酶、脲酶活性及土壤铵态氮(NH_4~+-N)、硝态氮(NO_3~--N)含量的季节变化特征。结果表明,土壤转化酶、脲酶活性和NH_4~+-N含量具有明显的季节变化特征(P<0.05),且均在6月达到峰值;土壤转化酶、脲酶活性和NO_3~--N含量均随土层深度的增加显著降