基于蚁群算法和轮盘算法的多Agent Q学习

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:zy15400444
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了一种新颖的基于Q-学习、蚁群算法和轮盘赌算法的多Agent强化学习。在强化学习算法中,当Agent数量增加到足够大时,就会出现动作空间灾难性问题,即:其学习速度骤然下降。另外,Agent是利用Q值来选择下一步动作的,因此,在学习早期,动作的选择严重束缚于高Q值。把蚁群算法、轮盘赌算法和强化学习三者结合起来,期望解决上述提出的问题。最后,对新算法的理论分析和实验结果都证明了改进的Q学习是可行的,并且可以有效地提高学习效率。
其他文献
成簇算法是传感器网络中减少能量消耗的一种关键技术,它能够增强网络的扩展性和延长网络的生存时间。异构传感网络在能量节约方面的性能更好。提出一种适应异构无线传感器网络
在比较单价法与实物法计价方法优缺点的基础上,确认实物法计价方法以适应社会主义市场经济体制的需要,对现行预算定额、费用定额和利润率等提出改革意见以与此相适应。
提出了一种结合粗糙集和粒子群的连续属性离散化算法,采用了MPSO算法的思想,提高了粒子群摆脱局部极值的能力,得到了较好的离散化效果。对不同的数据集进行了多次测试,结果表明该
<正>艺术是相通的,优秀的艺术家总能引起同道的关注和欣赏。著名画家程十发(1921—2007)曾赞扬"尚长荣的戏吸引人"①,"吸引人"是一种评价,也是一种评论。那么,尚长荣的戏到底
本文总结分析了实验室管理体系内部审核中存在的问题及其产生的原因,提出了提高实验室管理体系内部审核有效性的方法和途径。
本文介绍了实验室培训实施精细化管理的主要思路与做法。培训精细化教学管理的主要思路流程化;实施精细化教学管理的主要做法是:教学流程管理必须坚持资源整合、精细化实施、有
上海市城市排水水监测站成立于1984年,系上海市城市排水有限公司全额投资的具有独立法人资格的专业检测机构。
膝关节骨性关节炎(Knee osteoarthritis,KOA)又称退行性膝关节骨性关节病,是由于创伤、持续劳损、肥胖等原因所致关节软骨出现原发性或继发性退行性改变,并伴有软骨下骨质增生,
针对Ant-Mine算法提出一种新的条件选择策略-双条件选择策略。将该策略应用于Ant—Miner算法中,并与原Ant—Miner算法在两个公开的数据集上进行实验比较,结果表明应用了双条件
本文提出了一种通过采用DDS来抑制原子喷泉钟微波泄漏产生频移的方法。重点介绍了实现原理和DDS的FPGA电路实现,并给出了FPGA设计的仿真。从喷泉钟实验结果来看,微波泄漏频移被