基于平均报酬强化学习的电梯群组调度研究

来源 :系统仿真学报 | 被引量 : 4次 | 上传用户:willamshao520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对电梯群控系统,建立基于平均报酬强化学习的优化调度模型。采用R-learning的平均报酬强化学习求解算法,在分析电梯群组调度问题特点的基础上,利用径向基函数神经网络解决行为值函数的存储与泛化问题,并结合电梯群组虚拟仿真环境进行验证。通过与两种典型的电梯群组调度算法进行比较,展示了平均报酬强化学习算法在处理具有吸收目标状态的大规模随机序贯决策问题的有效性及可行性。
其他文献
我国高技术产品贸易呈现高速增长的态势,形成高度集中的格局徐永昌第二次世界大战以来,国家之间综合国力的对比关系发生了一系列重大变化,形成了新的国际竞争格局。长期以来,世界
详细阐述了一起600 MW机组励磁变高压侧V相引线的故障情况,分析了保护动作逻辑,描述了故障处理方法,提出了改进及预防措施,供同行参考。
【正】中国能源行业在经济社会转型发展期将去向何处?能源变革能否撼动传统化石能源在能源供应中占据的主力地位?各位专家纷纷展望了未来10年甚至20年内的能源变化趋势。"新
在开放网络中,信任管理是信息安全的重要前提与基础。主观信任具有模糊性和不确定性的双重特征。将定性定量转换模型-云模型引入主观信任管理研究中,提出了一种新的主观信任的表示方法,较好地解决了信任表达中的模糊性和不确定性难题,进而提出了一种灵活直观,描述能力较强的形式化定性信任推理机制,为主观信任管理研究进行了有益的探索和尝试。
电能计量装置能否准确计量对于供电企业至关重要。在高压工业用户中,计量用电压互感器保险中相熔断是常见的计量故障;详细分析了此种情况下更正系数的计算,为供电企业在电量
试论我国高技术企业评价问题曾道先,卢家仪正如世界著名的管理大师德鲁克指出的那样,我们现在确实是处于一场重大的技术变革时期。以高新技术为核心的新技术革命正在全世界范围
Q:汉能曾经公开喊话企业要有创新的精神和勇气,但创新也是有风险的,你们怎么看创新与风险?A:风险没有任何人能规避,但不能因此就停止创新的步伐。以汉能为例,除了在不断试错中发布新
管延丽,一个看似普通而决不乏睿智的女人,她靠自己勤劳的双手,书写了一段自强、自立的创业历程。从下岗女工,如今成长为吉林省知名的大米种植销售行业的领军人物。20年来,她
针对临涣中利发电有限公司辅控DCS改造后的硬件、软件及应用操作方面进行简要叙述,阐述了科远NT6000V3A DCS系统的性能结构,说明其软件系统配置、应用操作、组态画面修改方面
敛圆口,孤形深壁,敦厚凝重,制作精美,造型独特。宜德时期盆器的青花纹饰,画意生动豪放,笔法流利醋畅,粗细得当,浓淡适度,而且题材内容广泛,多具有突出的年代特征,景德镇御窑石遗址出土的