基于半自治agent的profit-sharing增强学习方法研究

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:liangjielin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在基于半自治agent的系统中应用profit-sharing增强学习方法,并与基于动态规划的Q-learning增强学习方法进行比较,在不确定因素较多的动态环境中,当系统状态变化不是一个马尔科夫过程时profit-sharing方法具有很大优势。根据半自治agent中半自治的特性——受制性,提出了一种面向基于半自治agent的增强学习模型,以战场仿真中安全隐蔽的寻找模型为实例对基于半自治agent的profit-sharing增强学习模型进行了试验分析。
其他文献
本刊讯(特约通讯员柏斌)为进一步落实提升昭通苹果优势特色产业,促进农民增收和农业增效,昭通市农产品质量安全中心近日在鲁甸县文屏镇砚池山村举行了2015年昭通市苹果质量安全
全球范围的数字广播系统DRM(Digital Radio Mondiale),是一种针对30MHz以下频段的数字声音广播系统。和传统广播系统相比,DRM数字广播系统在声音质量上是模拟调幅广播无法比拟的
提出了一种适合于超大规模地形的渲染的实时拼接技术。其核心思想是基于地形动态载入技术,对地形可见部分实时载入、拼接和渲染。该方法解决了地形边界匹配的问题,使得缝合的地形不产生裂缝,实现自然还原。在PIV2.2G、ATI9550显卡、512MBRAM的硬件平台上,本技术可实现大约144km2的地形实时渲染。实现表明,该方法能够提高渲染速度,降低内存开销,适合于超大规模地形的实时可视化。此项设计也是游戏
装配建模的实质就在于如何在计算机内有效地表达装配体外在的和内在的关系。在分析装配体几何实体信息模型、配合联接信息及设计约束机制的基础上,提出了一种以层次结构信息
目的探讨脑磁图定位和神经导航方法二者结合在癫痫外科的应用价值.方法选择12例顽固性癫痫手术,术前脑磁图确定皮质癫痫灶及中央后回感觉皮质范围,然后与神经外科导航系统结
目的建立大鼠骨髓间质干细胞(mesenchymal stem cells,MSCs)分离及培养的方法,探讨体外培养MSCs的生物学特性.方法通过全骨髓贴壁法分离培养大鼠MSCs,镜下连续观察细胞的形态
6月初菲律宾多家社会团体呼吁国会通过拖延已久的禁止在全国香蕉种植园空中喷洒农药的法案。社会团体指出,这种具有争议的喷洒杀虫剂的方法对社区及环境害处很大。排除这种方
目的:制备检测DMD基因常见易缺失外显子的核苷酸探针,通过反向斑点杂交试验验证其特异性,为初步研制DMD基因诊断芯片作准备。方法:从健康人外周静脉血白细胞提取基因组DNA,应用经
通过对黄征等人的拍卖方案(文献[1])的分析,发现其方案中用于检验竞拍者标价的随机数的产生过程存在着安全隐患.这将导致竞拍者标价的提前泄露。针对这类情况,提出了相应的改进方
Kainate(KA)受体属于离子型谷氨酸受体(iGluRs)的一类亚型受体,与其它两种iGluRs,NMDA受体(N-甲基-D-门冬氨酸)和AMPA受体(氨基-3-羟基-5甲基-4-异恶丙酸)相比,具有其自身的生物学特性。