DDPG算法相关论文
为了克服深度强化学习训练时间长、收敛速度慢的问题,针对密集动态障碍环境下的无人机(UAV)路径规划,引入了增量式发育知识库,对深度确......
数据驱动方法作为一种经济有效的反向设计方法已经越来越多地应用在光学材料和系统的开发中。光子晶体反射谱图的特征与其光学性质......
随着防空系统的综合化和智能化,使用多无人机代替有人机执行高风险的压制敌防空(SEAD)作战任务十分重要。针对传统智能优化算法求解任......
随着城市范围的扩大和人口数量的增加,建设城市轨道交通成为了解决交通拥堵的重要方式,其安全性、准点性和实时性也越来越受到重视。......
路径规划问题是一个非常经典的问题,在很多领域有广泛应用,通过深度强化学习技术来解决路径优化问题近年来吸引了大量学者关注,已......
为解决空域日益拥堵、空中交通流量日益增加等问题,美国联邦航空管理局提出了自由飞行的概念。伴随该概念的提出,空中交通管制问题......
路径规划是无人车实现自主化和智能化的关键技术之一,由于实际环境的多样化,就需要路径规划算法具有较高的适应性。因此,本文采用......
为了缓解单个自动驾驶车辆的计算负担,移动边缘计算(Mobile Edge Comput-ing,MEC)作为一种可靠的计算模式被应用于车联网中,允许计算......
针对强化学习方法训练能耗控制系统时所存在奖赏稀疏的问题,将一种基于自监督网络的深度确定策略梯度(deep deterministic policy ......
针对大型医用设备人工管理效率低、无法满足应急调度需求的问题,文中提出了基于深度强化学习算法的医用设备应急调度优化技术。使......
针对传统冷源系统节能优化方式机理建模复杂,缺乏自我学习能力,优化速度较慢等问题,提出一种基于数据驱动和自我学习机制的冷源系......
鉴于船舶在航行时受到风、浪和流等不确定因素干扰,传统的船舶航迹控制方法难以在不确定环境且控制系统处于多输入、多输出的条件......
深度强化学习(DRL)在连续控制问题中具有优异的性能,被广泛用于路径规划等领域.为了实现移动机器人在未知环境中的智能路径规划,提......
摘 要:为更好的实现对工业制造领域中机械臂的控制,结合当前的深度学习算法,提出一种改进奖励函数的DDPG机械臂控制方法。在该方法中,......
为了解决巡航导弹面临动态预警机雷达威胁下的突防航迹规划问题,提出一种改进深度强化学习智能航迹规划方法。针对巡航导弹面对预......
双足机器人是腿足机器人领域的研究热点和重要的研究方向,相对于轮式、履带式其他类型的移动方式的机器人而言,具有更高灵活性和环......
随着我国城镇化的战略实施,越来越多的人使用私家车作为交通出行工具。利用人工智能、大数据相关知识处理交通问题成为研究的热点......
随着内河水运业的快速发展,运输船舶日渐增加,船舶航行安全受到越来越多的关注。船舶避碰作为船舶航行安全的核心问题,逐渐成为当......
随着无人驾驶领域的快速发展,深度确定性策略梯度算法逐渐成为主流应用方法。在复杂环境下,动作维度较高时DDPG算法无法区分最优动......
分布式电采暖具备可时移特性,能够作为需求响应资源,但其数量多、单体容量小,调度中心难以直接控制,且传统优化方法难以满足调度时......
无人机的集群化应用技术是近年来的研究热点,随着无人机自主智能的不断提高,无人机集群技术必将成为未来无人机发展的主要趋势之一......
针对任务型对话系统缺少大规模真实训练数据的问题,提出一种结合规划的离散深度确定性策略梯度(deep deterministic policy gradie......
针对传统煤矸石分拣机械臂控制算法如抓取函数法、基于费拉里法的动态目标抓取算法等依赖于精确的环境模型、且控制过程缺乏自适应......
随着人工智能的飞速发展,无人驾驶成为汽车行业的研究热点,安全可靠的智能驾驶策略能够解放驾驶员双手,改善驾驶体验,具有极为重要......
深度强化学习是机器学习领域的一门新兴学科,它结合了深度学习的感知能力以及强化学习的控制决策能力。基于深度强化学习的金融交......
为了提高基于强化学习的自动驾驶车控制算法的学习效率,提出了一种结合专家经验的自动驾驶策略学习算法(deep deterministic polic......
针对国网现有应用的配电台区综合监控系统存在的若干不足,提出了一种基于多智能体共享信息的配电台区智能决策系统。引入多智能体......
卫星姿态控制是航天工程中非常重要的环节之一,是指按照预定的目标姿态使卫星运动到目标姿态,并且控制还应满足具有一定的鲁棒性、......