深度强化学习相关论文
近年来,随着人工智能和机器人技术的高速发展,机器人的应用场景也愈发复杂,逐渐从结构化环境向非结构化环境过渡。功能单一、结构......
伴随着可再生能源普及率的提高,在面对可再生能源间歇性和实时变化性,以往的能源管理策略逐渐暴露出各种局限性和缺点,已经无法满......
自从1954年George Devol发明第一台可编程机器人以来,机器人已经陪伴人类走过半个多世纪,并逐渐成为人类生产生活中不可或缺的助手......
物联网是由传感、通信和计算组成的互联网络,已成为近年来研究的热点。由于大量智能设备和应用的接入,对物联网资源分配带来巨大的......
随着无线网络领域蓬勃发展,具有分布式、自组织等特性的无线自组网技术得到越来越广泛的研究和应用。而当无线自组网规模变大需要......
近年来,四足机器人因其出色的机动性及环境适应能力而成为研究热点。与此同时,日益复杂的应用环境及任务对四足机器人自主性能提出......
柔索驱动并联机器人凭借其工作空间大、载重比大、运动精度高等优点在各方面得到了广泛应用,由于柔索在工作空间中的分布很容易受......
股票市场的预测是深度学习领域中最具挑战的应用之一,股市的数据复杂多变,具有很强的波动及数据集的庞大等特性。现有的研究方向大......
近年来,动态、不确定环境下的序贯决策问题成为人工智能和控制等领域的研究热点。部分可观测马尔可夫决策过程(POMDP)为这类问题提供......
当前疫情的爆发给人们的生活带来了极大的不便,而基于传感器技术和智能算法的移动机器人领域已经有了长足的发展,移动机器人已经可......
随着用户数量和数据业务的显著增长,卫星通信系统需要更高的吞吐量和更大的容量。在有限的无线资源条件下,高通量卫星如何通过智能化......
虚拟电厂(Virtual Power Plant,VPP)作为泛在电力物联网的基本组成单元,将随着三型两网建设的开展成为我国能源互联与共享技术研究的......
为了应对业务需求和数据流量爆炸式增长,星地网络成为下一代移动通信的主流架构。虚拟网络功能(Virtual Network Function,VNF)迁移......
面对复杂的三维环境,传统的路径规划算法计算复杂度极度增加,失去了原有的效果。深度强化学习可以不依赖于精确的环境模型,其总体效率......
针对正交频分复用的多蜂窝网络系统,提出了一种基于深度强化学习的通信资源分配算法,该算法在满足资源分配高速率、低延时要求的前提......
边缘缓存能够有效降低服务时延、缓解回程链路流量压力以及提升用户体验质量,可用于解决现有移动通信网络架构难以支撑的数据流量极......
随着无人播种机的广泛使用,无人播种机与工作空间发生碰撞的事件越来越多,因此避免和减少无人播种机空间碰撞问题对降低播种的安全风......
为解决传统的机器人路径规划算法维度高、收敛慢、建模难等问题,本文工作提出一种新的路径规划算法,该算法基于深度强化学习软演员评......
现有的路径规划算法对路径规划过程中的路径安全性问题考虑较少,并且传统的PPO算法存在一定的方差适应性问题。为解决这些问题,提出......
盲人是一个数量众多,特性突出、特别需要帮助的社会群体,盲人的出行已经成为中国乃至世界备受关注的问题。作为人类的重要感觉器官......
电商行业飞速发展,庞大的货物量对仓储容量要求越来越大。AGV作为智能仓储系统中一种常用的搬运工具,在大面积集成式仓储环境下,其......
随着大数据时代的到来,深度神经网络在人工智能领域的应用获得了前所未有的关注。深度学习的成功不仅仅依赖于计算资源的快速增长,......
六足机器人直接在现实环境中进行避障训练,会出现数据采样效率低、样机与障碍物产生碰撞造成零件出现不可逆损伤等情况。采用迁移学......
六足机器人在离散环境下进行落脚点规划是一个具有挑战性的任务。传统的多接触运动规划方法采用周期性步态或将步态与落足点规划视......
随着搬运系统的搬运模式不断更新、发展,一种由外骨骼等设备辅助工人完成搬运工作的新型搬运模式逐渐得到应用.在该模式下,传送带......
随着计算机软硬件技术的发展,增强现实技术逐渐被应用于虚实融合的教学实验场景中。增强现实技术能够模拟许多真实世界中难以接触......
随着移动通信技术的不断发展,边缘计算技术开始逐渐应用于一些特殊的业务场景,例如灾害地区救援和森林火灾预警。这些应用场景对任......
车辆智能驾驶技术的发展和推广在保障交通安全、提高交通效率、建设智能交通等方面有重要价值。然而,当前车辆智能驾驶系统中的环......
针对深度强化学习对交互环境的依赖性导致的其在跨工况设备故障诊断中可移植性差的问题,提出一种D3QN (Dueling doubling deep Q net......
作为机器学习和人工智能领域的重要分支之一,完全合作类多智能体深度强化学习以一种通用的方式将深度强化学习的表达决策能力和多智......
针对由卫星光网络拓扑动态变化、业务多样化和负载不均引起的路由收敛慢和波长利用率低的问题,提出了一种基于深度强化学习的卫星光......
为提高5G基站闲置储能的利用率,设计了一种5G基站储能参与电网调度的多基站储能系统,采用参与电网需求响应和低储高放的协同调度机制......
本文描述了无人机群航路规划的内容、意义,对相应任务环境及飞行平台进行了建模,并基于DQN的深度强化学习方法提出了无人机集群协......
无蜂窝大规模多输入多输出(multiple-input multiple-output,MIMO)技术采用大量接入点(access point,AP)为地面用户提供高效的通信服务......
现如今,随着移动通信技术的快速发展,移动设备需要应对更加多样化的移动应用,对于计算资源的需求也在急剧增加。传统的云计算难以......
空战智能决策将极大地改变未来战争的形态与模式。深度强化学习决策机可以挖掘飞行器潜力,是实现空战智能决策的重要技术范式,但是其......
针对目前矿井传感器所收集数据的传输效率差、实时性低、丢包率高等问题,提出了一种基于深度强化学习的无人机矿井自主巡航解决方法......
机器博弈一直是人工智能领域最具挑战的研究方向之一,也被称为人工智能领域的试金石。机器博弈根据博弈者是否能获取所有场面信息,......
深度强化学习是人工智能研究中的热点问题,随着研究的深入,其中的短板也逐渐暴露出来,如数据利用率低、泛化能力弱、探索困难、缺乏推......
移动机器人穿越动态密集人群时,由于对环境信息理解不充分,导致机器人导航效率低且泛化能力弱。针对这一问题,提出了一种双重注意深度......
大数据技术发展产生的海量数据急需一种可靠的数据存储方法,现有的主动故障预测方法相比被动容错机制可取得更好的效果,但是故障硬盘......
针对现有传统拥塞控制算法难以适应高度动态变化的无线自组网链路环境的问题,提出了一种基于深度强化学习的拥塞控制性能提升方法 E......
基于深度强化学习,提出了一种双经验池深度强化学习模型,并应用于不平衡样本数据下的滚动轴承故障诊断。该方法设计了用于存储多样本......
随着机器人技术在工业生产中的广泛运用,人们对机器人的控制要求也逐步提高,越来越多的应用场景,不仅需要对机器人的位置控制精度......
近些年交通拥堵日益严重,缓解拥堵的主要方法是调控交通信号灯以合理指挥车辆通行。现有信号灯大多通过固定时间规则控制,无法根据实......