基于递阶强化学习的多智能体AGV调度系统

来源 :控制与决策 | 被引量 : 0次 | 上传用户:Liujc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
递阶强化学习是解决状态空间庞大的复杂系统智能体决策的有效方法。具有离散动态特性的AGV调度系统需要实时动态的调度方法,而具有MaxQ递阶强化学习能力的多智能体通过高效的强化学习方法和协作,可以实现AGV的实时调度。仿真实验证明了这种方法的有效性。
其他文献
所谓过滤材料,不论金属材料和非金属材料,它们都是由纤维制成的片状打卷供应的物资(也有金属粉末烧结片状),所以有人称之为滤纸(金属纤维滤材有的称之为滤毡、金属纤维毡).它
运用GAMIT/GLOBK软件,对南极长城站与周边的各IGS跟踪站的GPS观测数据进行组网解算。在解算各站上空总天顶延迟的过程中,利用不同的星历进行解算,并对其解算结果进行了分析和探讨
对于马克思早期的哲学意识形态批判与后期的政治经济学批判之间的关系,学界出现了"断裂论"(阿尔都塞)、"双向建构论"(张一兵)、"构建论"(孙正聿)、"内在贯通论"(卜祥记)等观点。"内在贯通论"契
1957年Isaass与Lindenman首先发现干扰素(Interferon),并证实其有广谱抗病毒、抗肿瘤和免疫调节等多种作用。我科自1991年1月~1992年3月,应用冻干人—α干扰素1.5万单位小剂
为提升煤矿企业经济效益,文章深入分析了企业管理与经济效益之间的关系,并研究了通过科学的、合理的企业管理来有效提升企业经济效益的具体措施,以期能有效降低企业成本,显著
该文主要考虑与Jacobi算子相关的Hardy不等式. 主要结果之一是求得了相关不等式的最佳常数. 作为该不等式的应用之一,该文证明了,不同于欧式空间情形,双曲空间上的Hardy 不等式
王世贞在模拟乐府之余力求新创,融入自身情感,注重在写新事时度以古调,追求曲调和法度服从于真性情,并将叙事扩大到官场权力关系之中,从而创作出“乐府变”组诗。王世贞通过
肿瘤细胞侵袭和转移的过程中肿瘤细胞与宿主相互作用的极复杂的多环节过程,包括:1)从原发病灶脱离;2)向周围组织浸润;3)突破血管或淋巴管的基底膜进入血液或淋巴循环;4)离开
追求企业利润最大化是企业的经营目标之一。企业在不违反法律法规的前提条件下,通过对纳税主体的经营活动或投资行为等涉税事项做出事先安排,从而降低企业的税收负担,实现企
在一维分段广义正交多项式的基础上,提出多维分段广义正交多项式及其相应的正交多项式算子的定义,总结归纳了多维分段广义正交多项式算子的基本性质和主要运算规则,并将二维