动态分层强化学习相关论文
为解决大规模强化学习中的"维度灾难"问题,克服以往学习算法的性能高度依赖于先验知识的局限性,本文提出一种基于概率模型的动态分层......
强化学习因具有自学习和在线学习的良好特性,已经成为机器学习领域的一个重要分支。然而,强化学习本身存在“维度灾难”问题,所需......