【摘 要】
:
设计了一种借助历史数据自主学习的电梯群控调度算法,算法利用了增强学习技术在历史经验中的不断试错而获得最佳策略.以马尔可夫决策过程作为电梯派送问题的数学模型,进而将
【机 构】
:
河北工业大学控制科学与工程学院河北省控制工程技术研究中心河北科技大学校长办公室
论文部分内容阅读
设计了一种借助历史数据自主学习的电梯群控调度算法,算法利用了增强学习技术在历史经验中的不断试错而获得最佳策略.以马尔可夫决策过程作为电梯派送问题的数学模型,进而将一种内在递归神经网络与增强学习中的Q-learning方法结合,所得电梯群控调度算法通过迭代得到近似的最佳状态行为值函数及对应的决策结果,实现优化派梯.通过仿真实验,在不同的交通流设置下,将所提出的派梯算法与其他几种传统派梯方法进行比较,仿真测试结果验证了该算法的有效性和优越性.
其他文献
在汽车电子控制电路中,继电器(Relay)是一个必不可少的器件。设计汽车电子控制电路时,继电器是采用逻辑代数的方法进行计算的,因为继电器的工作只有断开(表述为“0”)和闭合(表述为“
王蒙《在伊犁》系列小说中构筑了农民群像和恋爱青年群像,主要采用二元对立、原生态的创作理念塑造人物,多层次、多角度地挖掘人物性格的深度,通过对人物群像的展现,也寄寓了
新春佳节临近,2020武侯祠成都大庙会文创区项目施工现场热火朝天。笔者看到,文创产品展位搭建、商业街铺设、新春灯组等工程都在紧锣密鼓地进行中。据了解,今年大庙会文创区
崩岗是南方最严重的侵蚀类型。通过分析崩岗侵蚀空间上的分布和成因,表明:崩岗主要分布在淮河以南亚热带湿润地带,主要集中分布在花岗岩母质区,垂直空间上分布在海拔100~500m丘陵
这是一场没有硝烟的战争。成千上万医护人员“主动请缨、不论生死”,在前方冲锋陷阵,无疑是疫情防控阻击战的主角,他们是我们这个时代最可爱的人。而医疗物资的保障有序,则是这场
未来企业家能否抓住这个时代机遇,带领企业取得持续成功,关键在于企业家能否自律。企业家自律有六个新内涵:持续自我反思、持续奋斗的信念、成就创新的自我认知、君子谋财取
近日,国家互联网信息办公室印发《互联网群组信息服务管理规定》(以下简称《管理规定》)。《管理规定》一出,“谁建群谁负责”“谁管理谁负责”成为网友热议话题,“群聊9不原则”
【正】 震撼世界的中国人民解放战争,如一幅雄伟壮丽的历史画卷,一首气壮山河的英雄史诗,吸引着革命人民的无限怀念,鼓午着人们为消除人间的黑暗,向着光明前进!永远前进!一九
俄语同义词数量巨大,不仅丰富了语言的表现力和感染力,也增强了语言的感情色彩。本文从同义词的界定、基本类型入手,从语言表达和认知两个层面探讨其使用价值及语用效果。
利用1996-2006年辽宁省高等教育相关数据,以丹尼森模型为基础分析得出:由于辽宁省GDP增长率高、高等教育普及水平较低等原因致使辽宁省高等教育对GDP增长率的贡献率低于西方发