多智能体强化学习相关论文
近年来,随着人工智能(artificial intelligence,AI)技术的快速发展,博弈论在社会智能、合作智能、机器智能、多智能体学习、AI安全和......
伴随着无线通信技术的快速发展以及人工智能技术的迅猛兴起,智能体的概念逐渐出现在现代生活和先进的生产活动当中。智能体是指具......
即时策略游戏因与现实环境有着相似决策的环境,可模拟实际问题难点,是绝佳的研究解决现实问题的平台。平台取得的研究成果在经济、......
电动汽车数量的快速增长给电动汽车充电市场带来困难与挑战。其中,电动汽车在并网时带来的额外需求会对电网造成很大的冲击。在现......
交通拥堵是当前世界上大多数城市所面临的一个日益严重的问题,其对公众的出行和整个社会的发展都造成了一系列负面影响,如人们出行......
强化学习是现代人工智能的重要方向之一,其丰富的应用场景使该研究方向具有重要的现实意义。强化学习通过与环境交互的方式为智能......
多智能体系统由一系列同构或异构的智能体构成,系统内智能体之间相互作用,常常形成竞争或者合作关系,从而可以涌现出更高阶的复杂......
针对无人机群目标打击任务分配问题,提出一种基于强化学习的无人机智能任务分配方法。该方法提出一种任务分层框架,将多个无人机视为......
在当前信息时代的背景下,随着高新科学技术的不断发展,军用和民用领域的许多任务场景对于无人技术的需求日益增加。无人机因灵活机......
针对任务随订单动态到达环境下的纺织面料染色车间动态调度问题,以最小化总拖期时间为优化目标,提出了基于多智能体循环近端策略优化......
为解决数量不定的同构水面无人艇(USV)集群以期望队形协同集结的问题,提出了一种基于多智能体深度强化学习的分布式控制方法。首先,针......
随着深度神经网络的不断发展,深度强化学习算法逐渐在运筹学、机器人控制、自动驾驶等领域大放异彩。然而在更贴近现实世界的场景......
近年来无人潜航器对国家海洋国土安全带来的威胁逐渐增大,同时它的低噪声特性和隐蔽入侵方式也给反潜行动带来极大困难。为此提出了......
肝癌是致死率极高的癌症之一,其首选治疗方式是手术切除肿瘤部位。但由于肝癌患者常伴有肝硬化或者在确诊时已到中晚期,约有80%的......
随着无线通信的发展,频谱资源利用率低这一现象已经引发了广泛关注。为了使不可再生的频谱资源得到更充分地利用,多项技术被用来实......
随着柔性制造系统和智能仓储系统的快速发展,自动导引车(Automated Guided Vehicle,AGV)的应用需求日益增长。AGV是一种装备有电磁学......
针对当前立体全景视频传输缺少有效的流自适应方法,且传统全景视频流自适应策略传输双目立体全景视频使得传输数据加倍,所需带宽巨大......
在小批量定制化的生产模式下,柔性车间作业排程对工厂的产能起到决定性作用。经典的数学方法缺乏可扩展性,基于演化算法的新方法代......
强化学习是人工智能的重要分支之一,近年来受到了广泛的关注与研究。强化学习以奖励为唯一的指导,利用不断试错的方式,使得智能体......
随着城市中车辆数量的增加,道路的负载变大,城市交通系统中的交通拥堵等问题越来越严重。道路通行能力主要受交叉路口的影响,而路......
多智能体系统是分布式人工智能的一个重要分支,在无人系统协同、资源管理、队形控制等领域有着广泛的应用。近年来,深度强化学习被......
近年来,得利于无线通信技术的快速发展,全球移动设备的数量已经远远大于主机型电子设备。移动设备在给人类带来便利的同时,也在科......
近年来,随着人工智能浪潮的兴起,“AI+”成为了这个时代的主流,诞生出了许多创新型的智慧产品。而对话系统在智能家居、智慧客服以......
为了缓解单个自动驾驶车辆的计算负担,移动边缘计算(Mobile Edge Comput-ing,MEC)作为一种可靠的计算模式被应用于车联网中,允许计算......
现如今,多智能体系统已经成为人工智能中的一个研究热点。单个智能体的计算及决策能力有限,导致其不能处理复杂的任务,因此越来越......
多智能体协同决策是人工智能领域的一个热门的研究方向,在实际生活中有着重要的作用。随着深度强化学习在单智能体领域的成功,越来......
认知无线电技术打破了目前频谱使用固定分配方案的局限性,允许次级用户自适应调整传输参数以利用空闲的频谱资源进行数据传输,大大......
基于通信的列车运行控制(Communication Based Train Control,CBTC)系统是保证列车安全、高效运行的关键设施。由于信息攻击手段不断......
强化学习是一类学习“做什么”的机器学习算法。它的目标是学习一个策略函数来解决序列决策问题,也就是将环境的一系列状态映射成......
列车调度问题是铁路交通领域的重要研究课题,高效合理的列车时刻表不仅能最大限度地缓解交通压力,同时也能有效减少列车的通勤时间......
深度学习和机器学习是未来智能无线通信的关键技术。传统的无线通信通常是模型驱动的,其相应的系统设计由领域知识导出。对于数学......
强化学习是一种以试错机制与环境进行交互,通过最大化累计奖赏的方式来优化策略的机器学习方法,在解决无模型的控制和决策问题上具......
染色工序作为纺织产业链中的关键工序之一,是染整制造生产管控的瓶颈所在,通过染色车间调度提高产品的准时交付并降低生产成本是纺......
无人机以其成本低、部署灵活的特性,已成为当前无线网络的关键组成部分。而如何对其进行轨迹规划,来提高无人机通信系统的性能,是......
智能汽车作为智能交通系统重要组成部分之一,其有助于缓解交通拥堵、减少交通事故等,是当前车辆工程领域研究的热点。在智能汽车搭......
针对基于委托权益证明(Delegated?Proof-of-Stake,?DPoS)?共识算法的区块链赋能车联网系统中区块验证的安全性与可靠性问题,?矿工......
基于多智能体博弈的元搜索结果动态融合算法,论文创新性地提出了基于多智能体博弈的知识动态融合技术,通过对源搜索引擎搜索结果的......
5G时代移动设备产生了海量数据,其中大多数是多媒体内容。通过无线网络传输如此规模的多媒体内容将会消耗大量无线频谱资源,进而导致......
电子病历以电子化的方式记录了患者诊断治疗的全过程,是医疗信息系统的核心。乳腺疾病是一种常见的女性多发疾病,其中乳腺癌已成为女......
随着5G技术的飞速发展和全球汽车持有量的快速增加,将超可靠低延迟通信服务(Ultra-Reliable Low-Latency Communication Services,U......
近年来,人们在强化学习领域的研究已经取得了令人瞩目的成就。然而在场景较为复杂时,传统的强化学习算法面临维度灾难以及长期信度分......
针对车联网频谱资源稀缺问题,提出一种基于柔性致动-评价(SAC)强化学习算法的多智能体频谱资源动态分配方案。以最大化信道总容量......
针对认知无线电网络中多个异质用户具有不同的服务质量(QoS)要求,提出一种基于多智能体强化学习的动态频谱分配方法.该方法从用户......