深度确定性策略梯度相关论文
联邦学习是近年来热门的分布式机器学习框架,能够在保护各个本地节点数据安全的同时以较小的通信开销完成整体模型的训练任务。这......
近年来,各种基于人工智能的应用在越来越多的领域中逐步取得比原有方法更好的效果。其中,自动驾驶逐渐成为人工智能领域最重要的落......
随着居民综合能源系统(residential integrated energy system,RIES)中能源类型、设备种类愈加丰富,如何应对多能异质负荷与外部能源......
冰蓄冷空调系统利用夜间多余电能蓄冷,白天蓄冰槽辅助制冷机组供冷,减轻了电网供电压力。和普通空调系统相比,冰蓄冷空调系统初始......
无人驾驶是当今人工智能技术热门应用场景之一,也是众多学者的研究热点。路径规划作为无人驾驶的关键技术之一,对推动智能汽车的快......
随着科技的发展,机器人越来越广泛地应用于各行各业,机械臂作为机器人的一个主要分支也越来越多地出现在科研、医疗、工业等场景中......
随着无人机技术的发展,对无人机空战攻防对抗决策提出了新的要求。本文以深度强化学习为基础,对复杂空战环境下的无人机空战攻防对......
针对传统模型受功率随机波动性影响以及易忽略重要信息从而导致预测精度低的问题,提出两种基于注意力(attention)机制的深度确定性策......
由于传统能源的不可再生性以及人们对能源的需求越来越大,传统能源的枯竭已成为不得不面对的问题。新能源开始不断被人发掘利用,由......
多能互补协同运行是综合能源系统实现运行经济效益最优的重要技术之一。针对引入间歇性可再生能源的电-气综合能源微网运行优化问......
谐振式微波传感器因其测量精度高、检测速度快、成本低、无创等特点,在各种工业传感应用中受到了广泛的关注并迅速发展。本论文致......
旋翼类飞行器一直以来在各个领域都有广泛的研究,这其中就包括旋翼飞行器的自主降落技术,为了实现旋翼飞行器能够精准稳定降落到未......
针对履带式车辆自主行驶控制中滑动参数难以精确估计和在复杂地面条件下难以稳定跟踪目标路径的问题,提出一种考虑履带车辆滑动转......
直线电机具有直驱特性和“零驱动”模式,能够很好的克服传统直线伺服系统在精度和迟滞方面的不足。本文基于三个直线电机模组耦合......
针对空间机械臂在轨捕获问题,提出了一种基于深度强化学习原理的柔顺捕获控制方法,采用深度确定性策略梯度算法设计了控制器.在仿......
无线驱动通信网络中,无线设备(WD)可以通过无线反向散射和主动射频传输两种方式进行数据卸载.如何合理分配系统中WD的主动传输和反......
针对空战中飞机如何根据实时态势进行快速智能决策问题,提出基于改进DDPG算法的空战行为决策框架(Air Combat Behavior Decision-m......
为解决无人驾驶路径规划过程中的决策控制问题,文章针对深度确定性策略梯度算法在未知环境中随着搜索空间的增大,出现训练效率低、......
汽车纵向自动驾驶的决策层根据车辆当前运动状态与环境信息,决策出理想的动作指令.目前如何在自动驾驶决策策略中考虑人类驾驶员的......
针对蒸汽发生器精确建模困难和低工况下控制性能差的问题,本文提出了一种基于深度强化学习优化的智能分层(IH)控制器.使用串级PI控......
无人地面车辆自主导航系统是智能交通的重要组成部分,对人类社会的发展进步有着重要意义。近年来无人地面车辆自主导航系统相关的......
路径规划是人工智能领域的一个重要研究领域,在国防军事、交通运输、机器人导航等诸多领域有着广泛的应用。目前就这一领域的研究......
随着航天、航空以及核能电站等领域的设备集成度不断提高,其内部工作空间越来越狭小,环境越来越复杂,内部作业要求越来越高。而蛇......
能耗限制的服务质量优化问题一直以来都是数据中心虚拟机资源管理所面临的巨大挑战之一.尽管现有的工作通过虚拟机整合技术一定程......
针对传统深度确定性策略梯度算法(Deep Deterministic Policy Gradient,DDPG)在机械臂轨迹规划中学习效率低、规划时间长的问题,提......
针对传统仿生智能算法处理异构光伏发电功率预测精确建模问题时存在的线路多阻抗参数约束下方差波动、线损分析易陷入局部极值等不......
对深度确定性策略梯度算法训练智能体学习小型无人飞行器的飞行控制策略进行了探索研究.以多数据帧的速度、位置和姿态角等信息作......
为提升无人机飞行控制的智能化水平,本文在深度确定性策略梯度(DDPG)算法框架下对四旋翼飞行器进行目标高度控制.具体地,将系统状......
强化学习中的连续控制问题一直是近年来的研究热点。深度确定性策略梯度(Deep Deterministic Policy Gradients,DDPG)算法在连续控......
在云环境下,如何在兼顾应用性能和虚拟机资源利用率的前提下,将大规模、动态的工作负载分配给云服务器是一个重要的挑战.为了解决......
为满足自适应巡航系统跟车模式下的舒适性需求并兼顾车辆安全性和行车效率,解决已有算法泛化性和舒适性差的问题,基于深度确定性策......
为了解决车辆队列控制中的车辆连续精确控制问题和行驶过程中车辆队列纵向稳定性问题,提出了 一种在中等速度环境下基于深度强化学......
近年来,随着信息技术和互联网技术的快速发展,数据增长速度远远超出了人类对信息的认知处理速度,不可避免地带来信息过载的问题。......
针对现有随机路由防御方法对数据流拆分粒度过粗、对合法的服务质量(QoS)保障效果不佳、对抗窃听攻击的安全性有待提升等问题,提出......
无线频谱资源的短缺及其较低的利用率一直是移动通信技术发展的瓶颈,作为移动通信技术的重要组成部分,LTE(长期演进,Long Term Evo......
为解决深度强化学习训练时间长、收敛慢的问题,该文针对未知环境下的机器人路径规划,基于深度确定性策略梯度(DDPG)算法,结合人工......
针对带有优先经验回放机制的深度强化学习中存在的学习效果容易受到时序误差离群值的不利影响、学习过程忽略立即回报和时间差分误......
冷源系统的能效水平对中央空调系统运行、公共建筑节能都有较大影响,国家于2019年提出建设高效冷源机房的目标,针对众多既有大型公......
飞机规避中距空空导弹的逃逸机动策略对于提高战斗机的生存力至关重要。针对深度确定性策略梯度算法训练智能体学习飞机规避导弹的......
提出了基于和树—深度确定性策略梯度(Sumtree DDPG)的多路口智能交通信号控制算法,通过对交叉路口数据的实时观测,智能地调控交通......
针对深度确定性策略梯度算法存在的经验利用率不高和性能差的问题,提出一种基于深度确定性策略梯度算法的复合优先经验回放算法.利......
综合能源系统的优化调度对于实现系统的多能互补和经济运行具有重要意义.然而,系统中可再生能源的间歇性以及用户用能需求的不确定......
传统网络因其控制平面与转发平面紧耦合,使得系统的升级成本较大,且网络的运行和维护工作量较大。软件定义网络(Software-Defined ......
将深度强化学习技术应用于投资组合管理,采用深度强化学习中的深度确定性策略梯度DDPG(Deep Deterministic Policy Gradient)算法,......