优先级扫描相关论文
结合了深度学习和强化学习,深度强化学习(DRL)在许多领域得到广泛的应用,是目前机器学习领域的研究热点。DRL算法利用深度学习对输......
多无人机协同侦察监视在情报侦察、战场监视等领域有着广泛的应用,如何将多无人机部署于复杂环境中执行侦察监视任务,是一个影响多......
不确定环境的时序决策问题是强化学习研究的主要内容之一,agent的目标是最大化其与环境交互过程中获得的累计奖赏值.直接学习方法寻......
贝叶斯Q学习方法使用概率分布来描述Q值的不确定性,并结合Q值分布来选择动作,以达到探索与利用的平衡。然而贝叶斯Q学习存在着收敛......