基于蚁群算法和轮盘算法的多Agent Q学习

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户：zy15400444

【摘要】

：

提出了一种新颖的基于Q-学习、蚁群算法和轮盘赌算法的多Agent强化学习。在强化学习算法中，当Agent数量增加到足够大时，就会出现动作空间灾难性问题，即：其学习速度骤然下降。另外

【作者】

：

孟祥萍王圣镔王欣欣

【机构】

：

长春工程学院电气与信息学院,东北电力大学信息工程学院

【出处】

：

计算机工程与应用

【发表日期】

：

2009年16期

【关键词】

：

多Agent强化学习算法蚁群算法轮盘赌算法 muhiagent reinforcement learning algorithm ant colony al

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

提出了一种新颖的基于Q-学习、蚁群算法和轮盘赌算法的多Agent强化学习。在强化学习算法中，当Agent数量增加到足够大时，就会出现动作空间灾难性问题，即：其学习速度骤然下降。另外，Agent是利用Q值来选择下一步动作的，因此，在学习早期，动作的选择严重束缚于高Q值。把蚁群算法、轮盘赌算法和强化学习三者结合起来，期望解决上述提出的问题。最后，对新算法的理论分析和实验结果都证明了改进的Q学习是可行的，并且可以有效地提高学习效率。

其他文献

使用部署知识的异构传感器网络有效成簇算法

成簇算法是传感器网络中减少能量消耗的一种关键技术，它能够增强网络的扩展性和延长网络的生存时间。异构传感网络在能量节约方面的性能更好。提出一种适应异构无线传感器网络

期刊

无线传感器网络成簇算法异构部署知识wireless sensor networks clustering algorithm heterogeneo

试论工程造价计价方法的改革

在比较单价法与实物法计价方法优缺点的基础上，确认实物法计价方法以适应社会主义市场经济体制的需要，对现行预算定额、费用定额和利润率等提出改革意见以与此相适应。

期刊

计价定额工程造价valuation method fixed amount

粗糙集与粒子群算法结合的属性离散化方法

提出了一种结合粗糙集和粒子群的连续属性离散化算法，采用了MPSO算法的思想，提高了粒子群摆脱局部极值的能力，得到了较好的离散化效果。对不同的数据集进行了多次测试，结果表明该

期刊

粒子群优化粗糙集离散化Particle Swarm Optimization（PSO）rough setdiscretization

从时代中的“尚长荣”到“尚长荣时代”——改革开放40年“评尚”历史脉络及启示

<正>艺术是相通的,优秀的艺术家总能引起同道的关注和欣赏。著名画家程十发(1921—2007)曾赞扬"尚长荣的戏吸引人"①,"吸引人"是一种评价,也是一种评论。那么,尚长荣的戏到底

学位

尚长荣龚和德改革开放

浅谈提高实验室管理体系内部审核有效性的方法与途径

本文总结分析了实验室管理体系内部审核中存在的问题及其产生的原因,提出了提高实验室管理体系内部审核有效性的方法和途径。

期刊

实验室管理体系内部审核有效性方法途径

实验室培训实施精细化管理的主要思路与做法

本文介绍了实验室培训实施精细化管理的主要思路与做法。培训精细化教学管理的主要思路流程化；实施精细化教学管理的主要做法是：教学流程管理必须坚持资源整合、精细化实施、有

期刊

实验室培训精细化管理思路做法

上海市城市排水监测站

上海市城市排水水监测站成立于1984年，系上海市城市排水有限公司全额投资的具有独立法人资格的专业检测机构。

期刊

城市排水上海市监测站独立法人资格检测机构

针刺配合热敏灸疗法治疗膝关节骨性关节炎的临床观察

膝关节骨性关节炎（Knee osteoarthritis,KOA）又称退行性膝关节骨性关节病,是由于创伤、持续劳损、肥胖等原因所致关节软骨出现原发性或继发性退行性改变,并伴有软骨下骨质增生,

期刊

灸疗法针刺方法骨科常见病用针刺关节面退行性疾病关节软骨临床观察关节疼痛反应点

基于双条件选择策略的Ant—Miner算法

针对Ant-Mine算法提出一种新的条件选择策略-双条件选择策略。将该策略应用于Ant—Miner算法中，并与原Ant—Miner算法在两个公开的数据集上进行实验比较，结果表明应用了双条件

期刊

蚁群优化Ant-Miner双条件选择策略ant colony optimizationAnt-Minerdual condition choose str

用于抑制微波泄漏频移的DDS研制

本文提出了一种通过采用DDS来抑制原子喷泉钟微波泄漏产生频移的方法。重点介绍了实现原理和DDS的FPGA电路实现，并给出了FPGA设计的仿真。从喷泉钟实验结果来看，微波泄漏频移被

期刊

DDSFPGA仿真频移

基于蚁群算法和轮盘算法的多Agent Q学习

与本文相关的学术论文