论文部分内容阅读
移动Ad Hoc网络由于其节点移动性强、拓扑结构动态变化的特点,对路由算法有收敛速度快、动态适应性强、信息容错度高等要求。现有的路由选择算法大多数不能很好解决移动Ad Hoc网络的动态变化特性带来的诸多问题。近几年,深度强化学习是人工智能领域的研究热点,在高维空间和决策控制方面有较好的表现。首先介绍了移动Ad Hoc网络及其特性,总结了路由选择问题的特性、要求及研究现状;然后,从基于值函数的深度强化学习路由研究、基于策略梯度的深度强化学习路由研究以及结合图神经网络的深度强化学习路由选择算法三个方面分析了深