深度强化学习相关硕士博士期刊学术论文

深度强化学习相关论文

模块化机器人构型-运动策略优化方法研究

近年来,随着人工智能和机器人技术的高速发展,机器人的应用场景也愈发复杂,逐渐从结构化环境向非结构化环境过渡。功能单一、结构......

学位

运动策略优化构型-运动协同优化深度强化学习演化计算模块化机器人仿真实验平台开发

能源互联网网络架构与智能能量管理策略研究

伴随着可再生能源普及率的提高,在面对可再生能源间歇性和实时变化性,以往的能源管理策略逐渐暴露出各种局限性和缺点,已经无法满......

学位

能源互联网能源管理移动边缘计算深度强化学习卸载优化

未知室内场景的自主三维重建

自从1954年George Devol发明第一台可编程机器人以来,机器人已经陪伴人类走过半个多世纪,并逐渐成为人类生产生活中不可或缺的助手......

学位

自主三维重建场景理解深度强化学习路径规划视点规划

面向边缘网络的资源分配与任务调度研究

物联网是由传感、通信和计算组成的互联网络,已成为近年来研究的热点。由于大量智能设备和应用的接入,对物联网资源分配带来巨大的......

学位

物联网资源分配博弈论未来博弈深度强化学习协作计算边缘计算瞬态数据缓存任务调度

基于深度强化学习的量子控制与量子信息处理

机器学习是以统计学为基础的科学,它利用大数据从中学习并作出预测。对数据的收集和分析是包括物理学在内的现代科学的特征。在物......

学位

量子控制量子信息量子算法量子相变深度强化学习机器学习

自组织网络分布式波束成形技术研究

随着无线网络领域蓬勃发展,具有分布式、自组织等特性的无线自组网技术得到越来越广泛的研究和应用。而当无线自组网规模变大需要......

学位

无线自组网分布式协同传输深度强化学习 MAPPO算法单比特反馈

模块化四足机器人系统的研究与实现

近年来,四足机器人因其出色的机动性及环境适应能力而成为研究热点。与此同时,日益复杂的应用环境及任务对四足机器人自主性能提出......

学位

模块化四足机器人目标检测与跟踪深度强化学习目标跟随策略

基于深度强化学习的可重构索驱动并联机器人运动规划及避障研究

柔索驱动并联机器人凭借其工作空间大、载重比大、运动精度高等优点在各方面得到了广泛应用,由于柔索在工作空间中的分布很容易受......

学位

索驱动并联机器人深度强化学习运动学分析避障规划

基于深度强化学习的股票市场的分析与研究

股票市场的预测是深度学习领域中最具挑战的应用之一,股市的数据复杂多变,具有很强的波动及数据集的庞大等特性。现有的研究方向大......

学位

股票预测量化金融深度强化学习并行模块化模型

基于车联网场景下的边缘协作缓存策略研究

随着城市信息网络的日益成熟和车辆保有量的快速增长,车联网中许多前沿的应用技术和软件服务都可能依赖优越的计算、通信和存储资......

学位

车联网移动边缘计算协作缓存深度强化学习联邦学习社交感知注意力机制

部分可观测马尔可夫决策过程的状态估计与策略学习

近年来,动态、不确定环境下的序贯决策问题成为人工智能和控制等领域的研究热点。部分可观测马尔可夫决策过程（POMDP）为这类问题提供......

学位

部分可观测马尔可夫决策过程自适应卡尔曼滤波器多智能体协同定位信念表示学习深度强化学习

移动机器人全覆盖路径规划算法研究

当前疫情的爆发给人们的生活带来了极大的不便,而基于传感器技术和智能算法的移动机器人领域已经有了长足的发展,移动机器人已经可......

学位

移动机器人全覆盖路径规划深度强化学习回报函数

基于深度强化学习的卫星动态功率控制技术

随着用户数量和数据业务的显著增长，卫星通信系统需要更高的吞吐量和更大的容量。在有限的无线资源条件下，高通量卫星如何通过智能化......

期刊

深度强化学习功率控制智能化卫星通信

基于数据挖掘的虚拟电厂优化调度研究

虚拟电厂（Virtual Power Plant,VPP）作为泛在电力物联网的基本组成单元,将随着三型两网建设的开展成为我国能源互联与共享技术研究的......

学位

虚拟电厂数据挖掘深度学习深度强化学习优化调度

基于深度强化学习的多智能体路径规划

随着中国科技的高速发展,多智能体系统已在工业、军事、救援等方面发挥着重要作用,而有效的路径规划,是各类多智能体系统高效作业......

学位

多智能体路径规划深度强化学习循环神经网络注意力机制

面向星地网络的虚拟网络功能迁移策略研究

为了应对业务需求和数据流量爆炸式增长,星地网络成为下一代移动通信的主流架构。虚拟网络功能（Virtual Network Function,VNF）迁移......

学位

虚拟网络功能迁移列生成深度强化学习

改进PPO算法的AUV路径规划研究

面对复杂的三维环境，传统的路径规划算法计算复杂度极度增加，失去了原有的效果。深度强化学习可以不依赖于精确的环境模型，其总体效率......

期刊

AUV 路径规划近端策略优化深度强化学习

基于深度强化学习的正交频分复用多小区蜂窝网资源分配方法

针对正交频分复用的多蜂窝网络系统，提出了一种基于深度强化学习的通信资源分配算法，该算法在满足资源分配高速率、低延时要求的前提......

期刊

深度强化学习正交频分复用蜂窝网资源分配神经网络

基于深度强化学习的无线网络边缘缓存技术综述

边缘缓存能够有效降低服务时延、缓解回程链路流量压力以及提升用户体验质量，可用于解决现有移动通信网络架构难以支撑的数据流量极......

期刊

无线网络边缘内容缓存深度强化学习缓存策略

基于深度强化学习的无人播种机自动路径规划研究

随着无人播种机的广泛使用，无人播种机与工作空间发生碰撞的事件越来越多，因此避免和减少无人播种机空间碰撞问题对降低播种的安全风......

期刊

无人播种机路径规划深度强化学习 RRT

基于SAC算法的移动机器人智能路径规划

为解决传统的机器人路径规划算法维度高、收敛慢、建模难等问题，本文工作提出一种新的路径规划算法，该算法基于深度强化学习软演员评......

期刊

深度强化学习路径规划 SAC算法连续奖励函数移动机器人

基于Safe-PPO算法的安全优先路径规划方法

现有的路径规划算法对路径规划过程中的路径安全性问题考虑较少，并且传统的PPO算法存在一定的方差适应性问题。为解决这些问题，提出......

期刊

机器人导航路径规划深度强化学习近端策略优化算法安全路径选择

基于深度强化学习的盲人行走导航辅助系统

盲人是一个数量众多,特性突出、特别需要帮助的社会群体,盲人的出行已经成为中国乃至世界备受关注的问题。作为人类的重要感觉器官......

学位

深度强化学习盲人行走导航语音交互目标检测

基于深度强化学习的大规模栅格网络路径规划方法研究

电商行业飞速发展,庞大的货物量对仓储容量要求越来越大。AGV作为智能仓储系统中一种常用的搬运工具,在大面积集成式仓储环境下,其......

学位

AGV路径规划超大规模栅格网络深度强化学习 BFS-DQN算法 Fast-PPO算法

交互式图像分割方法研究

随着大数据时代的到来,深度神经网络在人工智能领域的应用获得了前所未有的关注。深度学习的成功不仅仅依赖于计算资源的快速增长,......

学位

交互式图像分割深度强化学习区域融合超像素分割

基于渐进式神经网络的六足机器人避障策略迁移

六足机器人直接在现实环境中进行避障训练，会出现数据采样效率低、样机与障碍物产生碰撞造成零件出现不可逆损伤等情况。采用迁移学......

期刊

六足机器人避障策略深度强化学习渐进式神经网络迁移学习

基于DRL和自由步态的六足机器人运动规划研究

六足机器人在离散环境下进行落脚点规划是一个具有挑战性的任务。传统的多接触运动规划方法采用周期性步态或将步态与落足点规划视......

期刊

六足机器人自由步态深度强化学习多接触运动规划非结构环境

考虑工人疲劳的外骨骼助力搬运系统优化控制

随着搬运系统的搬运模式不断更新、发展,一种由外骨骼等设备辅助工人完成搬运工作的新型搬运模式逐渐得到应用.在该模式下,传送带......

会议

外骨骼助力搬运系统工人疲劳表面肌电信号深度强化学习

视频驱动的AR教学示范行为生成技术研究

随着计算机软硬件技术的发展,增强现实技术逐渐被应用于虚实融合的教学实验场景中。增强现实技术能够模拟许多真实世界中难以接触......

学位

RGB视频姿态估计深度强化学习示教学习虚拟手运动生成增强现实

用于主动配电网协调优化控制的深度强化学习方法及其应用研究

随着风电、光伏等分布式电源的高比例并网和电力电子设备的大规模接入,以及高速通信和人工智能等ICT技术在电力系统中的逐步深入和......

学位

主动配电网深度强化学习协调优化控制图卷积神经网络电压优化合环电流控制

面向空地网络环境的边缘计算模型及算法研究

随着移动通信技术的不断发展,边缘计算技术开始逐渐应用于一些特殊的业务场景,例如灾害地区救援和森林火灾预警。这些应用场景对任......

学位

边缘计算无人机路径规划计算卸载深度强化学习

基于拓扑空间的智能车辆行为决策与轨迹规划方法研究

车辆智能驾驶技术的发展和推广在保障交通安全、提高交通效率、建设智能交通等方面有重要价值。然而,当前车辆智能驾驶系统中的环......

学位

自主驾驶运动规划拓扑路径惩罚函数行为决策深度强化学习仿真平台

基于域泛化D3QN的跨工况故障诊断方法

针对深度强化学习对交互环境的依赖性导致的其在跨工况设备故障诊断中可移植性差的问题，提出一种D3QN （Dueling doubling deep Q net......

期刊

故障诊断域泛化特征筛选分治奖励深度强化学习

完全合作类多智能体深度强化学习综述

作为机器学习和人工智能领域的重要分支之一，完全合作类多智能体深度强化学习以一种通用的方式将深度强化学习的表达决策能力和多智......

期刊

深度强化学习多智能体完全合作人工智能

基于深度强化学习的卫星光网络波长路由算法

针对由卫星光网络拓扑动态变化、业务多样化和负载不均引起的路由收敛慢和波长利用率低的问题，提出了一种基于深度强化学习的卫星光......

期刊

卫星光网络波长路由深度强化学习服务质量

基于深度强化学习的5G基站储能调度策略

为提高5G基站闲置储能的利用率，设计了一种5G基站储能参与电网调度的多基站储能系统，采用参与电网需求响应和低储高放的协同调度机制......

期刊

深度强化学习基站储能调度策略经济效益

基于DQN深度强化学习的无人机智能航路规划方法

本文描述了无人机群航路规划的内容、意义,对相应任务环境及飞行平台进行了建模,并基于DQN的深度强化学习方法提出了无人机集群协......

会议

无人机深度强化学习 DQN 航路规划

无人机辅助无蜂窝大规模MIMO中的空地协同调度

无蜂窝大规模多输入多输出（multiple-input multiple-output,MIMO）技术采用大量接入点（access point,AP）为地面用户提供高效的通信服务......

期刊

无蜂窝大规模MIMO 无人机辅助通信联合空地调度深度强化学习

面向端-边协同的在线计算迁移关键技术研究

现如今,随着移动通信技术的快速发展,移动设备需要应对更加多样化的移动应用,对于计算资源的需求也在急剧增加。传统的云计算难以......

学位

边缘计算计算迁移资源分配深度强化学习

面向边缘计算的智能资源分配与计算迁移研究

为了满足物联网场景中不同用户的差异化需求和提高资源利用率,以构建一个高效的边缘计算服务系统,本文提出了一种基于优先级的物联......

期刊

计算迁移边缘计算任务优先级深度强化学习资源分配

基于深度强化学习的空战机动决策试验研究

空战智能决策将极大地改变未来战争的形态与模式。深度强化学习决策机可以挖掘飞行器潜力，是实现空战智能决策的重要技术范式，但是其......

期刊

近距空战智能决策深度强化学习人机对抗飞行试验

基于深度强化学习的无人机矿井自主巡航研究

针对目前矿井传感器所收集数据的传输效率差、实时性低、丢包率高等问题，提出了一种基于深度强化学习的无人机矿井自主巡航解决方法......

期刊

矿井深度强化学习无人机路径规划

基于改进的PPO算法的非完备信息机器博弈的研究与应用

机器博弈一直是人工智能领域最具挑战的研究方向之一,也被称为人工智能领域的试金石。机器博弈根据博弈者是否能获取所有场面信息,......

学位

非完备信息机器博弈博弈搜索树深度强化学习 PPO算法

深度强化学习中的知识迁移方法研究综述

深度强化学习是人工智能研究中的热点问题，随着研究的深入，其中的短板也逐渐暴露出来，如数据利用率低、泛化能力弱、探索困难、缺乏推......

期刊

人工智能知识迁移强化学习深度强化学习迁移学习

基于深度强化学习的机器人导航算法研究

移动机器人穿越动态密集人群时，由于对环境信息理解不充分，导致机器人导航效率低且泛化能力弱。针对这一问题，提出了一种双重注意深度......

期刊

深度强化学习奖励函数状态价值网络双重注意力

基于深度强化学习的故障硬盘预测与处理方法

大数据技术发展产生的海量数据急需一种可靠的数据存储方法，现有的主动故障预测方法相比被动容错机制可取得更好的效果，但是故障硬盘......

期刊

硬盘故障故障预测深度强化学习 DQN算法奖励塑造

基于深度强化学习的无线自组网拥塞控制性能提升方法

针对现有传统拥塞控制算法难以适应高度动态变化的无线自组网链路环境的问题，提出了一种基于深度强化学习的拥塞控制性能提升方法 E......

期刊

无线自组网拥塞控制深度强化学习

不平衡数据下基于双经验池深度强化学习的滚动轴承故障诊断

基于深度强化学习，提出了一种双经验池深度强化学习模型，并应用于不平衡样本数据下的滚动轴承故障诊断。该方法设计了用于存储多样本......

期刊

深度强化学习双经验池不平衡数据滚动轴承故障诊断

基于串联式六维力传感器的机器人力控方法研究

随着机器人技术在工业生产中的广泛运用,人们对机器人的控制要求也逐步提高,越来越多的应用场景,不仅需要对机器人的位置控制精度......

学位

深度强化学习阻抗控制柔顺控制深孔装配串联力传感器

基于联邦学习的智能交通灯控制方法

近些年交通拥堵日益严重，缓解拥堵的主要方法是调控交通信号灯以合理指挥车辆通行。现有信号灯大多通过固定时间规则控制，无法根据实......

期刊

联邦学习深度强化学习信号灯控制智能交通

看过本文同时还关注