近端策略优化算法相关硕士博士期刊学术论文

近端策略优化算法相关论文

基于Safe-PPO算法的安全优先路径规划方法

现有的路径规划算法对路径规划过程中的路径安全性问题考虑较少，并且传统的PPO算法存在一定的方差适应性问题。为解决这些问题，提出......

期刊

机器人导航路径规划深度强化学习近端策略优化算法安全路径选择

一种基于PPO-gSDE算法的双连续搅拌反应釜系统跟踪控制

连续搅拌反应釜（continuous stirring tank reactor，CSTR）是经典的化工设备，被广泛应用于化工过程。由于其具有较强的非线性和时滞性，传......

期刊

双连续搅拌反应釜深度强化学习非线性系统近端策略优化算法广义状态相关探索

规则引导的智能体决策框架

虽然近年来深度强化学习在决策智能中取得突破，但复杂场景中的巨大动作空间仍然是算法成功学习的一大挑战。导致这一问题的主要原因......

期刊

深度强化学习专家经验规则动作空间近端策略优化算法注意力机制

融合LSTM和PPO算法的移动机器人视觉导航

为提高移动机器人在无地图情况下的视觉导航能力，提升导航成功率，提出了一种融合长短期记忆神经网络（Long Short Term Memory， LSTM）和......

期刊

近端策略优化算法长短期记忆神经网络视觉导航

一种面向2V2近距空战的强化学习算法

针对深度强化学习算法在多对多近距空战决策过程中存在难以处理高维状态空间、难收敛等问题，提出一种基于注意力机制的近端策略优化......

期刊

近距空战近端策略优化算法强化学习注意力机制人工智能

结合深度强化学习与人工经验的电网断面功率调整方法

随着电力系统中新能源比例不断增加，区域间的能量传输变化愈加剧烈，因此，研究大电网断面功率调整方法十分必要。然而，由于传统算法存在......

期刊

潮流调整断面深度强化学习近端策略优化算法

应对新能源预测偏差不确定性的电力系统动态经济调度研究

2020年,我国在世界气候变化大会上做出了“碳中和、碳达峰”的承诺,预示着作为化石能源发电替代方式的新能源发电将迎来新的发展热......

学位

动态经济调度深度强化学习近端策略优化算法生成对抗模仿学习

基于深度强化学习潜艇攻防对抗训练指挥决策研究

潜艇和水面舰艇编队间的攻防对抗是潜艇作战研究的重点内容,如何确保潜艇在舰艇编队、反潜直升机等兵力的联合封锁下存活和突围,是......

期刊

智能指挥决策深度强化学习近端策略优化算法互博弈

强化学习算法在超视距空战辅助决策上的应用研究

摘要：针对近端策略优化算法在空战智能决策过程中面临的动作空间过大、难收敛等问题，提出基于option的近端策略分层优化算法，构建了基......

期刊

超视距空战智能决策人工智能强化学习近端策略优化算法分层强化学习

基于深度强化学习的机械臂抓捕控制研究

在轨抓捕技术是世界各航天大国研究的热门领域。我国空间站即将建成,对空间机械臂的应用也具有很大需求。深度强化学习(Deep Reinf......

学位

机械臂抓捕深度强化学习比例导引法近端策略优化算法

基于近端优化的永磁同步电机温度预测方法

为了精准有效地实现永磁同步电机的温度预测,提出了一种基于近端策略优化(PPO)算法和强化学习(RL)网络的永磁同步电机温度预测模型......

期刊

永磁同步电机温度预测近端策略优化算法强化学习 PMSM Temperature prediction Proximal policy optimizati

基于PPO的机械臂控制研究方法

目前应用于机械臂控制中有许多不同的算法,如传统的自适应PD控制、模糊自适应控制等,这些大多需要基于数学模型。也有基于强化学习......

期刊

强化学习机械臂近端策略优化算法 Actor-Critic算法离线学习 reinforcement learning robot manipulator p

基于深度强化学习的城市道路交通控制算法研究

随着我国城镇化率和人均机动车保有量的不断提高,许多城市面临着交通拥堵的困境。近年来随着科技不断进步,大数据、人工智能、深度......

学位

交通信号控制深度强化学习大规模交通网格路网深度Q网络近端策略优化算法

基于深度强化学习的三维路径规划算法

合理的路线选择是智能体三维路径规划研究领域的难点。现有路径规划方法存在不能很好地适应未知地形,避障形式单一等问题。针对这......

期刊

深度强化学习近端策略优化算法路径规划复杂未知场景 deep reinforcement learningProximal Policy Optimizat

基于强化学习的非玩家角色AI系统设计与实现

人工智能(Artificial Intelligence,AI)领域发展迅速,对于强化学习的研究也在诸多领域达到了很好的实际应用效果,配合深度学习的感......

学位

强化学习非玩家角色人工智能近端策略优化算法

看过本文同时还关注