切换导航
文档转换
企业服务
Action
Another action
Something else here
Separated link
One more separated link
vip购买
不 限
期刊论文
硕博论文
会议论文
报 纸
英文论文
全文
主题
作者
摘要
关键词
搜索
您的位置
首页
期刊论文
基于递阶强化学习的多智能体AGV调度系统
基于递阶强化学习的多智能体AGV调度系统
来源 :控制与决策 | 被引量 : 0次 | 上传用户:Liujc
【摘 要】
:
递阶强化学习是解决状态空间庞大的复杂系统智能体决策的有效方法。具有离散动态特性的AGV调度系统需要实时动态的调度方法,而具有MaxQ递阶强化学习能力的多智能体通过高效的
【作 者】
:
李晓萌
杨煜普
等
【机 构】
:
上海交通大学自动化研究所
【出 处】
:
控制与决策
【发表日期】
:
2002年3期
【关键词】
:
递阶强化学习
多智能体
AGV调度系统
机器学习
hierarchical reinforcement learning MaxQ method coopera
下载到本地 , 更方便阅读
下载此文
赞助VIP
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
递阶强化学习是解决状态空间庞大的复杂系统智能体决策的有效方法。具有离散动态特性的AGV调度系统需要实时动态的调度方法,而具有MaxQ递阶强化学习能力的多智能体通过高效的强化学习方法和协作,可以实现AGV的实时调度。仿真实验证明了这种方法的有效性。
其他文献
中国过滤材料性能测试方法标准的现状与将来
所谓过滤材料,不论金属材料和非金属材料,它们都是由纤维制成的片状打卷供应的物资(也有金属粉末烧结片状),所以有人称之为滤纸(金属纤维滤材有的称之为滤毡、金属纤维毡).它
会议
过滤材料
性能测试
过滤
过滤器
GPS数据解算对流层天顶总延迟探讨
运用GAMIT/GLOBK软件,对南极长城站与周边的各IGS跟踪站的GPS观测数据进行组网解算。在解算各站上空总天顶延迟的过程中,利用不同的星历进行解算,并对其解算结果进行了分析和探讨
期刊
GAMIT/GLOBK
GPS数据
预报星历
精密星历
天顶延迟
“内在贯通论”视域中《资本论》的哲学性质新探
对于马克思早期的哲学意识形态批判与后期的政治经济学批判之间的关系,学界出现了"断裂论"(阿尔都塞)、"双向建构论"(张一兵)、"构建论"(孙正聿)、"内在贯通论"(卜祥记)等观点。"内在贯通论"契
期刊
“内在贯通论”
《资本论》
唯物史观
"inner linking theory""Das Capital"historical materialism
小剂量干扰素超声雾化吸入治疗小儿支气管肺炎40例报告
1957年Isaass与Lindenman首先发现干扰素(Interferon),并证实其有广谱抗病毒、抗肿瘤和免疫调节等多种作用。我科自1991年1月~1992年3月,应用冻干人—α干扰素1.5万单位小剂
期刊
雾化吸入治疗
小儿支气管肺炎
小剂量干扰素
试析以企业管理提升企业经济效益的措施——以煤矿企业为例
为提升煤矿企业经济效益,文章深入分析了企业管理与经济效益之间的关系,并研究了通过科学的、合理的企业管理来有效提升企业经济效益的具体措施,以期能有效降低企业成本,显著
期刊
煤矿企业
经营管理
经济效益
措施
Jacobi算子的Hardy不等式及其应用
该文主要考虑与Jacobi算子相关的Hardy不等式. 主要结果之一是求得了相关不等式的最佳常数. 作为该不等式的应用之一,该文证明了,不同于欧式空间情形,双曲空间上的Hardy 不等式
期刊
Jacobi算子
HARDY不等式
双曲空间
Jacobi operator Hardy inequality Hyperbolic space.
论王世贞的乐府诗及其“乐府变”的历史地位
王世贞在模拟乐府之余力求新创,融入自身情感,注重在写新事时度以古调,追求曲调和法度服从于真性情,并将叙事扩大到官场权力关系之中,从而创作出“乐府变”组诗。王世贞通过
期刊
王世贞
拟古乐府
乐府变
明乐府
Wang Shizhen modeled yuefu poems yuefu-variable poems Ming Yuef
Ⅳ型胶原酶及其抑制剂与肿瘤的侵袭和转移
肿瘤细胞侵袭和转移的过程中肿瘤细胞与宿主相互作用的极复杂的多环节过程,包括:1)从原发病灶脱离;2)向周围组织浸润;3)突破血管或淋巴管的基底膜进入血液或淋巴循环;4)离开
期刊
Ⅳ型胶原酶
抑制剂
肿瘤
侵袭
转移
企业降低税务成本方式分析
追求企业利润最大化是企业的经营目标之一。企业在不违反法律法规的前提条件下,通过对纳税主体的经营活动或投资行为等涉税事项做出事先安排,从而降低企业的税收负担,实现企
期刊
国际避税
税务成本
纳税筹划
利润最大化
税收经济
杠杆
多维分段广义正交多项式算子及其在分布参数系统辨识中的应用
在一维分段广义正交多项式的基础上,提出多维分段广义正交多项式及其相应的正交多项式算子的定义,总结归纳了多维分段广义正交多项式算子的基本性质和主要运算规则,并将二维
期刊
广义正交多项式算子
分布参数系统
参数辨识
Distributed parameter control systemsIdentification (contr
与本文相关的学术论文