值函数近似相关论文
板坯库是钢铁生产过程中连铸与热轧的中间环节,其物流作业主要包括入库、倒垛、出库和整理操作,这几种物流操作交替执行,并且入库......
针对大电网安全约束随机动态经济调度(DED)问题的求解时间太长,提出了应用近似动态规划算法快速求解不含抽水蓄能电站电网的安全约......
随着电力相关技术的不断发展,现代电力系统面临深刻的变革,经济调度作为电力系统的基本优化问题之一,面临着许多新的挑战。对大规......
伴随着超高压、特高压输电技术在国内的成功推进,以及在全球环境压力、碳排放压力下以风电、光伏为代表的新能源发电技术的快速发......
针对连续状态空间的非线性系统控制问题,提出一种基于残差梯度法的神经网络Q学习算法。该算法采用多层前馈神经网络逼近Q值函数,同......
针对自动化立体仓库出入库路径优化问题,对自动化仓库中堆垛机的作业模式进行了分析,创建了考虑堆垛机运行时间最短的目标优化数学......
针对复杂的、难以建模的城市交通系统,将多步强化学习算法SARSA(λ)应用于交通信号控制,根据实时的交通状态信息动态进行决策,自动适......
城市的区域交通信号协调系统是一个十分复杂的系统,难以建立准确的数学模型,通过引入主-从式团队强化学习方法于区域交通信号协调......