信度状态相关硕士博士期刊学术论文 - 搜论网

信度状态相关论文

不确定性环境下基于进化算法的强化学习

不确定性和隐状态是目前强化学习所要面对的重要难题．本文提出了一种新的算法MA．Q．learning算法来求解带有这种不确定性的POMDP问题近......

期刊

部分可观察马尔可夫决策过程 Q学习 MEMETIC算法信度状态隐状态 POMDP Q-learning Memetic algorithm belie

求解POMDP的动态合并激励学习算法

把POMDP作为激励学习(Reinforcement Learning)问题的模型,对于具有大状态空间问题的求解有比较好的适应性和有效性.但由于其求解......

期刊

部分可观测Markov决策过程激励学习动态合并信度状态 Partially observable Markov decision process Rei

看过本文同时还关注