近端策略优化算法相关论文
现有的路径规划算法对路径规划过程中的路径安全性问题考虑较少,并且传统的PPO算法存在一定的方差适应性问题。为解决这些问题,提出......
连续搅拌反应釜(continuous stirring tank reactor,CSTR)是经典的化工设备,被广泛应用于化工过程。由于其具有较强的非线性和时滞性,传......
虽然近年来深度强化学习在决策智能中取得突破,但复杂场景中的巨大动作空间仍然是算法成功学习的一大挑战。导致这一问题的主要原因......
为提高移动机器人在无地图情况下的视觉导航能力,提升导航成功率,提出了一种融合长短期记忆神经网络(Long Short Term Memory, LSTM)和......
随着电力系统中新能源比例不断增加,区域间的能量传输变化愈加剧烈,因此,研究大电网断面功率调整方法十分必要。然而,由于传统算法存在......
2020年,我国在世界气候变化大会上做出了“碳中和、碳达峰”的承诺,预示着作为化石能源发电替代方式的新能源发电将迎来新的发展热......
潜艇和水面舰艇编队间的攻防对抗是潜艇作战研究的重点内容,如何确保潜艇在舰艇编队、反潜直升机等兵力的联合封锁下存活和突围,是......
摘要:针对近端策略优化算法在空战智能决策过程中面临的动作空间过大、难收敛等问题,提出基于option的近端策略分层优化算法,构建了基......
在轨抓捕技术是世界各航天大国研究的热门领域。我国空间站即将建成,对空间机械臂的应用也具有很大需求。深度强化学习(Deep Reinf......
为了精准有效地实现永磁同步电机的温度预测,提出了一种基于近端策略优化(PPO)算法和强化学习(RL)网络的永磁同步电机温度预测模型......
目前应用于机械臂控制中有许多不同的算法,如传统的自适应PD控制、模糊自适应控制等,这些大多需要基于数学模型。也有基于强化学习......
随着我国城镇化率和人均机动车保有量的不断提高,许多城市面临着交通拥堵的困境。近年来随着科技不断进步,大数据、人工智能、深度......
合理的路线选择是智能体三维路径规划研究领域的难点。现有路径规划方法存在不能很好地适应未知地形,避障形式单一等问题。针对这......
人工智能(Artificial Intelligence,AI)领域发展迅速,对于强化学习的研究也在诸多领域达到了很好的实际应用效果,配合深度学习的感......