神经元动态规划相关论文
实际生活中的许多序贯决策问题,如柔性制造系统、交通指挥系统、排队系统等,都可以模型化为Markov决策过程(MDP)。出于实际应用的......
学位
离散事件动态系统(DEDS)是实际生活中广泛存在的一类人造系统,而半Markov决策过程(SMDP)是这类系统建模的主要方法之一。为了适应......
学位
基于Markov性能势理论和神经元动态规划(NDP)方法,研究一类连续时间Markov决策过程(MDP)在随机平稳策略下的仿真优化问题,给出的算......
随着互联网技术的快速发展以及智能设备的普及,基于HTTP的动态自适应流媒体(Dynamic Adaptive Streaming over HTTP,DASH)业务发展......
遗传算法被广泛应用于求解车间作业调度问题(JSP),但遗传算法具有最优参数难以确定的问题。对此,该文提出了一种基于神经元动态规......
Rollout算法是Bertsekas提出的求解马尔科夫决策过程(MDP)问题的一种仿真优化算法。文章研究Rollout算法求解多类商品库存控制问题......
文章在rollout算法基础上研究了在多Agent MDPs的学习问题.利用神经元动态规划逼近方法来降低其空间复杂度,从而减少算法"维数灾".由......
研究半马尔可夫决策过程(SMDP)基于性能势学习和策略逼近的神经元动态规划(NDP)方法.通过SMDP的一致马尔可夫链的单个样本轨道,给出了......
为适应实际大规模Markov系统的需要,讨论Markov决策过程(MDP)基于仿真的学习优化问题-根据定义式,建立性能势在平均和折扣性能准则下统......
基于性能势理论和等价Markov过程方法,研究了一类半Markov决策过程(SMDP)在参数化随机平稳策略下的仿真优化算法,并简要分析了算法的收......
可重入生产系统是以半导体和薄胶片生产为代表的一类复杂生产系统,在微电子行业飞速发展的今天,可重入生产系统已受到工业界和学术......
随着互联网技术的发展和服务的完善,网络流量呈现爆炸式增长,摩尔定律下互联网的建设速度已经远远赶不上业务需求增长速度,这其中......
提出一个基于神经元动态规划解决可重入生产系统调度问题的仿真框架.根据可重入生产系统的特点建立状态集,并将调度问题表示成相应......
神经元动态规划是近年发展起来的一种优化方法 .它采用计算机仿真和函数近似 ,简化对状态空间的搜索 ,可以有效克服“维数危机” ,......
论文在Markov性能势理论基础上, 研究了Markov控制过程在神经元网络等逼近结构表示的随机平稳策略作用下的仿真优化算法;分析了它......