深度确定性策略梯度相关硕士博士期刊学术论文

深度确定性策略梯度相关论文

边缘网络中联邦学习自适应资源优化方法研究

联邦学习是近年来热门的分布式机器学习框架,能够在保护各个本地节点数据安全的同时以较小的通信开销完成整体模型的训练任务。这......

学位

联邦学习分布式异构多智能体深度确定性策略梯度

基于强化学习的高速公路自动驾驶决策方法研究

近年来,各种基于人工智能的应用在越来越多的领域中逐步取得比原有方法更好的效果。其中,自动驾驶逐渐成为人工智能领域最重要的落......

学位

强化学习车道跟随自动超车深度确定性策略梯度近端策略优化

基于深度强化学习的居民综合能源系统管理研究

随着居民综合能源系统（residential integrated energy system,RIES）中能源类型、设备种类愈加丰富，如何应对多能异质负荷与外部能源......

期刊

居民综合能源系统深度强化学习深度确定性策略梯度动态调整经济效益

基于强化学习的冰蓄冷空调系统运行策略研究

冰蓄冷空调系统利用夜间多余电能蓄冷,白天蓄冰槽辅助制冷机组供冷,减轻了电网供电压力。和普通空调系统相比,冰蓄冷空调系统初始......

学位

冰蓄冷空调系统运行策略优化深度Q学习深度确定性策略梯度峰谷负荷差节能经济

室内全向移动机器人路径规划研究

移动机器人作为智能机器人的重要分支,一直是当前众多学者的研究热点,其路径规划和避障也是移动机器人技术研究中的核心内容。近年......

学位

强化学习移动机器人路径规划深度确定性策略梯度优先经验回放

基于深度强化学习的无人驾驶路径规划算法研究

无人驾驶是当今人工智能技术热门应用场景之一,也是众多学者的研究热点。路径规划作为无人驾驶的关键技术之一,对推动智能汽车的快......

学位

智能汽车路径规划深度确定性策略梯度奖励指导优先经验回放

基于深度强化学习的机械臂快速训练方法研究

随着科技的发展,机器人越来越广泛地应用于各行各业,机械臂作为机器人的一个主要分支也越来越多地出现在科研、医疗、工业等场景中......

学位

深度强化学习机械臂深度确定性策略梯度目标抓取降维

基于深度强化学习的无人机空战攻防对抗决策方法研究

随着无人机技术的发展,对无人机空战攻防对抗决策提出了新的要求。本文以深度强化学习为基础,对复杂空战环境下的无人机空战攻防对......

学位

无人机深度强化学习 Double DQN 隐蔽接敌深度确定性策略梯度围捕攻防对抗决策

基于attention机制的深度强化学习的超短期光伏功率预测

针对传统模型受功率随机波动性影响以及易忽略重要信息从而导致预测精度低的问题，提出两种基于注意力（attention）机制的深度确定性策......

期刊

深度强化学习光伏功率预测深度学习深度确定性策略梯度循环确定性策略梯度注意力机制

基于无人机的车辆网络覆盖增强机制研究

随着移动通信和物联网等关键通信技术的快速进步,车辆网络的发展和普及已经成为必然。车辆网络需要密集型基础设施部署以支持高计......

学位

无人机部署车辆网络遗传算法深度确定性策略梯度轨迹优化

基于深度强化学习的微电网能量优化管理研究

由于传统能源的不可再生性以及人们对能源的需求越来越大,传统能源的枯竭已成为不得不面对的问题。新能源开始不断被人发掘利用,由......

学位

微电网深度强化学习在线优化多智能体系统深度Q网络深度确定性策略梯度

基于深度确定性策略梯度的电-气综合能源微网优化调度研究

多能互补协同运行是综合能源系统实现运行经济效益最优的重要技术之一。针对引入间歇性可再生能源的电-气综合能源微网运行优化问......

期刊

电-气综合能源微网优化调度深度确定性策略梯度经济效益运行优化调度策略

基于机器学习的微波微流平面谐振式传感器优化设计

谐振式微波传感器因其测量精度高、检测速度快、成本低、无创等特点,在各种工业传感应用中受到了广泛的关注并迅速发展。本论文致......

学位

微波传感器微流通道粒子-蚁群优化算法狼群算法深度确定性策略梯度灵敏度介电常数

四旋翼自主降落控制系统设计

旋翼类飞行器一直以来在各个领域都有广泛的研究,这其中就包括旋翼飞行器的自主降落技术,为了实现旋翼飞行器能够精准稳定降落到未......

学位

四旋翼自主降落 X型四旋翼非线性数学模型传统控制深度确定性策略梯度

基于深度强化学习的车辆跟随决策算法研究

高级驾驶辅助系统是当今汽车主动安全技术领域的研究重点之一,主要包括汽车自适应巡航系统和前方防碰撞系统。目前市场上产品化的......

学位

车辆跟随半自动驾驶强化学习深度确定性策略梯度复合优先经验回放

地面不平条件下考虑滑动转向特性的履带车辆路径跟踪控制

针对履带式车辆自主行驶控制中滑动参数难以精确估计和在复杂地面条件下难以稳定跟踪目标路径的问题,提出一种考虑履带车辆滑动转......

期刊

履带车辆球-面接触原理滑移率估计深度确定性策略梯度路径跟踪

基于直线电机的3-PSS并联机器人动力学分析与控制研究

直线电机具有直驱特性和“零驱动”模式,能够很好的克服传统直线伺服系统在精度和迟滞方面的不足。本文基于三个直线电机模组耦合......

学位

直线电机运动学动力学深度确定性策略梯度非线性非奇异快速Terminal滑模控制

基于深度强化学习的空间机械臂柔顺捕获控制方法研究

针对空间机械臂在轨捕获问题,提出了一种基于深度强化学习原理的柔顺捕获控制方法,采用深度确定性策略梯度算法设计了控制器.在仿......

期刊

深度强化学习深度确定性策略梯度机械臂柔顺捕获

基于深度确定性策略梯度学习的无线反向散射数据卸载优化

无线驱动通信网络中,无线设备(WD)可以通过无线反向散射和主动射频传输两种方式进行数据卸载.如何合理分配系统中WD的主动传输和反......

期刊

反向散射数据卸载深度确定性策略梯度强化学习

基于改进DDPG的空战行为决策方法

针对空战中飞机如何根据实时态势进行快速智能决策问题,提出基于改进DDPG算法的空战行为决策框架(Air Combat Behavior Decision-m......

期刊

深度强化学习深度确定性策略梯度空战行为决策动态目标嵌入式人工经验奖励机制

改进深度确定性策略梯度的决策算法研究

为解决无人驾驶路径规划过程中的决策控制问题,文章针对深度确定性策略梯度算法在未知环境中随着搜索空间的增大,出现训练效率低、......

期刊

路径规划决策控制深度确定性策略梯度奖励指导优先经验回放

仿驾驶员DDPG汽车纵向自动驾驶决策方法

汽车纵向自动驾驶的决策层根据车辆当前运动状态与环境信息,决策出理想的动作指令.目前如何在自动驾驶决策策略中考虑人类驾驶员的......

期刊

自动驾驶决策算法深度强化学习深度确定性策略梯度

基于深度强化学习的蒸汽发生器水位控制

针对蒸汽发生器精确建模困难和低工况下控制性能差的问题,本文提出了一种基于深度强化学习优化的智能分层(IH)控制器.使用串级PI控......

期刊

蒸汽发生器深度强化学习深度确定性策略梯度水位控制状态信息奖励函数评价网络动作网络

4WS-4WD无人地面车辆自主导航系统研究与实现

无人地面车辆自主导航系统是智能交通的重要组成部分,对人类社会的发展进步有着重要意义。近年来无人地面车辆自主导航系统相关的......

学位

无人地面车辆 4WS-4WD车辆轨迹规划运动控制深度确定性策略梯度

基于深度强化学习的自动驾驶智能决策算法研究

自动驾驶汽车集环境感知、智能决策和协同控制于一体,能充分协调车辆与交通环境的关系,保证车辆的平稳安全行驶,是汽车未来发展的......

学位

自动驾驶技术深度强化学习智能决策深度确定性策略梯度基于种群的训练方法

基于强化学习的应急逃生路径规划研究

路径规划是人工智能领域的一个重要研究领域,在国防军事、交通运输、机器人导航等诸多领域有着广泛的应用。目前就这一领域的研究......

学位

强化学习深度强化学习长短期记忆网络深度确定性策略梯度路径规划

绳驱式蛇形机器人设计及控制策略研究

随着航天、航空以及核能电站等领域的设备集成度不断提高,其内部工作空间越来越狭小,环境越来越复杂,内部作业要求越来越高。而蛇......

学位

蛇形机器人烟花算法深度确定性策略梯度位置精度控制

基于深度强化学习的自适应虚拟机整合方法

能耗限制的服务质量优化问题一直以来都是数据中心虚拟机资源管理所面临的巨大挑战之一.尽管现有的工作通过虚拟机整合技术一定程......

期刊

数据中心虚拟机资源管理虚拟机整合强化学习深度确定性策略梯度

DDPG优化算法的机械臂轨迹规划

针对传统深度确定性策略梯度算法(Deep Deterministic Policy Gradient,DDPG)在机械臂轨迹规划中学习效率低、规划时间长的问题,提......

期刊

深度确定性策略梯度轨迹规划加权采样优先权

一种深度强化学习制导控制一体化算法

研究了一种基于深度强化学习理论的制导控制一体化算法.不同于传统的制导控制一体化算法和制导控制回路分开设计的方法,基于深度强......

期刊

制导控制一体化深度强化学习深度确定性策略梯度零控脱靶量启发式学习

基于改进DDPG算法的中短期光伏发电功率预测

针对传统仿生智能算法处理异构光伏发电功率预测精确建模问题时存在的线路多阻抗参数约束下方差波动、线损分析易陷入局部极值等不......

期刊

异构光伏发电网功率预测深度确定性策略梯度多智能体效能仿真验证 heterogeneous photovoltaic power grid power p

深度确定性策略梯度算法用于无人飞行器控制

对深度确定性策略梯度算法训练智能体学习小型无人飞行器的飞行控制策略进行了探索研究.以多数据帧的速度、位置和姿态角等信息作......

期刊

深度确定性策略梯度小型无人飞行器飞行控制端到端稀疏奖励

基于DDPG策略的四旋翼飞行器目标高度控制

为提升无人机飞行控制的智能化水平,本文在深度确定性策略梯度(DDPG)算法框架下对四旋翼飞行器进行目标高度控制.具体地,将系统状......

期刊

高度控制四旋翼飞行器深度强化学习深度确定性策略梯度神经网络

基于情节经验回放的深度确定性策略梯度方法

强化学习中的连续控制问题一直是近年来的研究热点。深度确定性策略梯度(Deep Deterministic Policy Gradients,DDPG)算法在连续控......

期刊

深度确定性策略梯度连续控制任务经验回放累积回报分类经验回放

基于深度确定性策略梯度的电网断面极限传输能力动态趋优控制

电力系统调度中心往往通过控制极限传输能力(total transfer capability,TTC),使之高于传输潮流,以保证运行安全性或扩大断面输电......

期刊

强化学习深度学习深度确定性策略梯度代理辅助模型极限传输能力

基于深度强化学习的异构云任务调度研究

在云环境下,如何在兼顾应用性能和虚拟机资源利用率的前提下,将大规模、动态的工作负载分配给云服务器是一个重要的挑战.为了解决......

期刊

深度强化学习任务调度云计算聚类深度确定性策略梯度

基于强化学习的多目标车辆跟随决策算法

为满足自适应巡航系统跟车模式下的舒适性需求并兼顾车辆安全性和行车效率,解决已有算法泛化性和舒适性差的问题,基于深度确定性策......

期刊

自主决策车辆跟随半自动驾驶强化学习深度确定性策略梯度马尔可夫决策过程

基于深度确定性策略梯度的队列纵向协同控制策略

为了解决车辆队列控制中的车辆连续精确控制问题和行驶过程中车辆队列纵向稳定性问题,提出了一种在中等速度环境下基于深度强化学......

期刊

交通工程深度强化学习队列纵向控制深度确定性策略梯度队列稳定性

基于机器学习的个性化推荐系统关键技术研究

近年来,随着信息技术和互联网技术的快速发展,数据增长速度远远超出了人类对信息的认知处理速度,不可避免地带来信息过载的问题。......

学位

个性化推荐系统深度学习深度强化学习用户画像深度确定性策略梯度

基于深度确定性策略梯度的随机路由防御方法

针对现有随机路由防御方法对数据流拆分粒度过粗、对合法的服务质量(QoS)保障效果不佳、对抗窃听攻击的安全性有待提升等问题,提出......

期刊

随机路由深度确定性策略梯度窃听攻击移动目标防御

基于深度强化学习的LTE空口资源分配算法研究

无线频谱资源的短缺及其较低的利用率一直是移动通信技术发展的瓶颈,作为移动通信技术的重要组成部分,LTE(长期演进,Long Term Evo......

学位

LTE移动通信系统资源分配 NS3-Gym 深度强化学习深度确定性策略梯度

基于改进DDPG算法的机器人路径规划算法研究

为解决深度强化学习训练时间长、收敛慢的问题,该文针对未知环境下的机器人路径规划,基于深度确定性策略梯度(DDPG)算法,结合人工......

期刊

深度确定性策略梯度机器人路径规划未知环境深度强化学习人工势场法

深度强化学习经验回放机制的改进方法研究

针对带有优先经验回放机制的深度强化学习中存在的学习效果容易受到时序误差离群值的不利影响、学习过程忽略立即回报和时间差分误......

学位

强化学习深度强化学习深度确定性策略梯度深度Q网络经验回放机制

基于强化学习的办公建筑冷源系统节能优化控制策略仿真研究

冷源系统的能效水平对中央空调系统运行、公共建筑节能都有较大影响,国家于2019年提出建设高效冷源机房的目标,针对众多既有大型公......

学位

强化学习冷源系统节能优化控制策略模型堆叠深度确定性策略梯度

基于深度确定性策略梯度算法的战机规避中距空空导弹研究

飞机规避中距空空导弹的逃逸机动策略对于提高战斗机的生存力至关重要。针对深度确定性策略梯度算法训练智能体学习飞机规避导弹的......

期刊

导弹规避逃逸机动策略深度确定性策略梯度深度强化学习

基于Sumtree DDPG的智能交通信号控制算法

提出了基于和树—深度确定性策略梯度(Sumtree DDPG)的多路口智能交通信号控制算法,通过对交叉路口数据的实时观测,智能地调控交通......

期刊

智能交通交通信号控制深度强化学习深度确定性策略梯度多路口

深度确定性策略梯度算法优化

针对深度确定性策略梯度算法存在的经验利用率不高和性能差的问题,提出一种基于深度确定性策略梯度算法的复合优先经验回放算法.利......

期刊

强化学习深度确定性策略梯度复合优先经验回放立即回报时间差分误差

基于深度强化学习的综合能源系统动态经济调度

综合能源系统的优化调度对于实现系统的多能互补和经济运行具有重要意义.然而,系统中可再生能源的间歇性以及用户用能需求的不确定......

期刊

综合能源系统动态经济调度强化学习深度确定性策略梯度

基于深度强化学习的SDN智能路由优化研究

传统网络因其控制平面与转发平面紧耦合,使得系统的升级成本较大,且网络的运行和维护工作量较大。软件定义网络(Software-Defined ......

学位

深度强化学习软件定义网络流量调度深度Q网络深度确定性策略梯度

基于深度强化学习DDPG算法的投资组合管理

将深度强化学习技术应用于投资组合管理,采用深度强化学习中的深度确定性策略梯度DDPG(Deep Deterministic Policy Gradient)算法,......

期刊

深度强化学习深度确定性策略梯度投资组合管理

看过本文同时还关注