启发式Q学习相关论文
民用的导航系统由于定位精度有限,无法对复杂的路况信息进行实时的探测;再加上导航系统缺乏针对盲人(视障人士)进行路径搜索与规划......
强化学习是一种无监督学习方法,它能够使智能体在环境模型未知的情况下利用环境奖赏发现最优的行为序列,因此被广泛用于多智能体系统......
针对集中式认知网络的信道和功率分配问题,提出了一种基于案例推理和启发式Q学习算法。为了提高Q学习算法的收敛速度,将当前分配问......