连续时间Markov决策过程相关论文
功能正确和性能可满足是复杂系统可信要求非常重要的两个方面。从定性验证和定量分析相结合的角度,对复杂并发系统进行功能验证和......
文章研究了计时报酬方式下最优呼叫接入控制问题,建立了系统的连续时间Markov决策过程(CT—MDP),根据系统特征引入后状态Q值更新方法,给......
本文考虑连续时间Markov决策过程平均报酬的方差优化问题.假设状态空间是可数的,行动空间是Borel可测空间.本文的主要目的是在确定......
无人机系统在恶劣气象条件和动态战场环境中的应用,给无人机控制技术带来不确定性、高度非线性、多输入多输出、输入通道耦合以及......