连续时间Markov决策过程相关硕士博士期刊学术论文

功能正确和性能可满足是复杂系统可信要求非常重要的两个方面。从定性验证和定量分析相结合的角度,对复杂并发系统进行功能验证和......

期刊

文章研究了计时报酬方式下最优呼叫接入控制问题，建立了系统的连续时间Markov决策过程（CT—MDP），根据系统特征引入后状态Q值更新方法，给......

期刊

本文考虑连续时间Markov决策过程平均报酬的方差优化问题.假设状态空间是可数的,行动空间是Borel可测空间.本文的主要目的是在确定......

学位

无人机系统在恶劣气象条件和动态战场环境中的应用,给无人机控制技术带来不确定性、高度非线性、多输入多输出、输入通道耦合以及......

学位