RoboCup中局部决策问题的强化学习

来源 :第十四届中国神经网络学术会议 | 被引量 : 0次 | 上传用户:yulekan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文研究了RoboCup中Agent决策的强化学习问题,同时为了降低决策问题的复杂度,提出了将全局决策划分为多个局部决策的思想。实验证明,Agent通过强化学习可以很好的解决局部决策问题。
其他文献
目的与方法分析小儿先天性肺囊性腺瘤样畸形congenital cystic adenomatoid malformation,CCAM及其合并其他先天畸形的CT表现,加强对本病的认识,提高诊断准确率。回顾性分析1
期刊
@@
本文对基于体元的形态测量学(VBM)进行了综述,对VBM方法进行了介绍,阐述了VBM的基本原理和实施步骤,并应用该方法对注意缺陷并多动障碍儿童的脑结构磁共振成像进行了处理和分
目的探讨激素替代-冻融胚胎移植周期阴道用黄体酮制剂的临床有效性、不良反应及对策。方法将2012年1月一2013年1月在上海交通大学医学院附属瑞金医院生殖医学中心行激素替代-
本文对概念格并行构造方法进行了探讨。本研究结合批生成算法和渐进式算法的优点,提出了一种并行算法。实验表明,该算法的时间性能和空间性能都有明显的提高。
本文对改进传统购物篮分析的关联规则挖掘进行了研究。文章根据用户领域知识的要求,计算该类商品的兴趣度加权阈值,如依据基于利润法、基于资金周转法等,改进传统的购物篮分
本文对基于动态影响图的多Agent决策模型进行了探讨。本研究提出了一种对在时间上演化的决策问题进行建模的动态影响图模型,利用局部概率模型来解决动态多Agent系统的模型表
目的探讨血红蛋白Constant Spring(Hb CS)携带者基因型和表型的关系。方法检测HbCS携带者的血常规和血红蛋白电泳,通过跨越断裂点PCR(gap—PCR)和反向点杂交方法检测α和β地
目的 分析富阳市2008 ~ 2012年间新生儿听力筛查情况,以便早期诊断、治疗、干预.方法 采用耳声发射仪(OAE)对新生儿进行初筛,未通过者42天进行复筛,复筛仍未通过者采用脑干听
目的 对临汾地区特教学校152例耳聋患者进行GJB2、PDS及mtDNA 1555位点突变分析,了解该地区耳聋患者的突变情况及分子学病因.方法 收集临汾地区152例耳聋患者,PCR扩增患者GJB
本实验采用单克隆抗体免疫组化及免疫荧光法标识神经元内神经丝的分布,在光镜、荧光显微镜及透射电镜下观察钒酸盐对神经丝的可逆性影响,并结合酶组化的双重标记,观察溶酶体
会议