基于半自治agent的profit-sharing增强学习方法研究

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户：liangjielin

【摘要】

：

在基于半自治agent的系统中应用profit-sharing增强学习方法,并与基于动态规划的Q-learning增强学习方法进行比较,在不确定因素较多的动态环境中,当系统状态变化不是一个马尔

【作者】

：

杨克巍张少丁岑凯辉谭跃进

【机构】

：

国防科技大学信息系统与管理学院

【出处】

：

计算机工程与应用

【发表日期】

：

2007年15期

【关键词】

：

增强学习半自治agent PROFIT-SHARING Q-LEARNING reinforcement learning semi-autonomous a

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

在基于半自治agent的系统中应用profit-sharing增强学习方法,并与基于动态规划的Q-learning增强学习方法进行比较,在不确定因素较多的动态环境中,当系统状态变化不是一个马尔科夫过程时profit-sharing方法具有很大优势。根据半自治agent中半自治的特性——受制性,提出了一种面向基于半自治agent的增强学习模型,以战场仿真中安全隐蔽的寻找模型为实例对基于半自治agent的profit-sharing增强学习模型进行了试验分析。

其他文献

云南·昭通举办苹果质量安全溯源体系建设项目培训会

本刊讯（特约通讯员柏斌）为进一步落实提升昭通苹果优势特色产业,促进农民增收和农业增效,昭通市农产品质量安全中心近日在鲁甸县文屏镇砚池山村举行了2015年昭通市苹果质量安全

期刊

苹果质量溯源体系建设项目鲁甸县文屏高原明珠叶来养分消耗植保专家兆祥

全球数字广播系统音频编码器的软件实现

全球范围的数字广播系统DRM（Digital Radio Mondiale），是一种针对30MHz以下频段的数字声音广播系统。和传统广播系统相比，DRM数字广播系统在声音质量上是模拟调幅广播无法比拟的

期刊

数字广播系统先进音频编码改进离散余弦变换音频编码器digital broadcasting system advanced audio coding

一种实现超大规模地形的拼接技术研究

提出了一种适合于超大规模地形的渲染的实时拼接技术。其核心思想是基于地形动态载入技术,对地形可见部分实时载入、拼接和渲染。该方法解决了地形边界匹配的问题,使得缝合的地形不产生裂缝,实现自然还原。在PIV2.2G、ATI9550显卡、512MBRAM的硬件平台上,本技术可实现大约144km2的地形实时渲染。实现表明,该方法能够提高渲染速度,降低内存开销,适合于超大规模地形的实时可视化。此项设计也是游戏

期刊

动态载入地形缝合细分层次dynamic loading terrain tiling Level-Of-Detail （LOD）

支持产品全生命周期设计的广义装配建模的研究

装配建模的实质就在于如何在计算机内有效地表达装配体外在的和内在的关系。在分析装配体几何实体信息模型、配合联接信息及设计约束机制的基础上,提出了一种以层次结构信息

期刊

产品全生命周期工程设计广义装配建模productLifecycle Engineering Design（LCED）general assembly

脑磁图与神经导航结合在癫痫外科的应用

目的探讨脑磁图定位和神经导航方法二者结合在癫痫外科的应用价值.方法选择12例顽固性癫痫手术,术前脑磁图确定皮质癫痫灶及中央后回感觉皮质范围,然后与神经外科导航系统结

期刊

脑磁图皮质功能区癫痫神经导航MagnetoencephalographyFunctional cortexEpilepsyNeuronavigat

成年大鼠骨髓间质干细胞的生物学特性研究

目的建立大鼠骨髓间质干细胞(mesenchymal stem cells,MSCs)分离及培养的方法,探讨体外培养MSCs的生物学特性.方法通过全骨髓贴壁法分离培养大鼠MSCs,镜下连续观察细胞的形态

期刊

骨髓间充质于细胞细胞培养增殖Bone marrow Mesenchymal stem cells Cell culture Prolifer

菲律宾：呼吁禁止香蕉园空中喷洒杀虫剂

6月初菲律宾多家社会团体呼吁国会通过拖延已久的禁止在全国香蕉种植园空中喷洒农药的法案。社会团体指出，这种具有争议的喷洒杀虫剂的方法对社区及环境害处很大。排除这种方

期刊

杀虫剂香蕉园菲律宾喷洒社会团体经济效益种植园环境

克隆外显子探针反向斑点杂交检测DMD基因缺失

目的：制备检测DMD基因常见易缺失外显子的核苷酸探针，通过反向斑点杂交试验验证其特异性，为初步研制DMD基因诊断芯片作准备。方法：从健康人外周静脉血白细胞提取基因组DNA，应用经

期刊

探针反向斑点杂交DMD基因缺失肌营养不良症克隆Probes Hybridization DND Gene deletions

一个新的多拍卖物的无收据密封式拍卖协议

通过对黄征等人的拍卖方案（文献[1]）的分析，发现其方案中用于检验竞拍者标价的随机数的产生过程存在着安全隐患．这将导致竞拍者标价的提前泄露。针对这类情况，提出了相应的改进方

期刊

电子拍卖多拍卖物安全多方计算秘密共享electronic auction multiple items secure multiparty co

Kainate受体与癫痫的研究进展

Kainate（KA）受体属于离子型谷氨酸受体（iGluRs）的一类亚型受体，与其它两种iGluRs，NMDA受体（N-甲基-D-门冬氨酸）和AMPA受体（氨基-3-羟基-5甲基-4-异恶丙酸）相比，具有其自身的生物学特性。

期刊

KA受体谷氨酸癫痫

基于半自治agent的profit-sharing增强学习方法研究

与本文相关的学术论文