论文部分内容阅读
基于强化学习的几类多智能体系统协同优化控制算法研究
【摘 要】
:
多智能体系统协同优化控制,主要是指系统中所有智能体在依靠分布式协作以完成某项全局控制任务的过程中,每个智能体还需要优化一个被建模为性能函数的预定目标。在多智能体系统协同控制的研究中,往往存在着系统模型的不精确或者简化的问题。研究发现,强化学习方法可应用于设计系统的优化控制算法,这些算法只需要知道系统部分模型或者完全不知道系统模型。因此,基于强化学习的多智能体系统协同优化控制算法研究引起了学者们的研
【机 构】
:
中国科学技术大学
【出 处】
:
中国科学技术大学
【发表日期】
:
2021年08期
【基金项目】
:
其他文献
高速切削加工过程复杂多变,刀具作为金属切削的直接执行部件,刀具状态的准确监控对于保证产品加工质量、提高经济效益、保障系统安全等起到了越来越重要的作用。建立准确、可靠的刀具状态监测系统能为各相关行业和前沿领域创造巨大的价值。围绕此目的,本文结合高斯过程在加工过程建模与刀具磨损预测性能方面的优势,根据改进的特征选择方法,提出了基于高斯过程回归的智能化刀具在线监测模型与实现方法。(1)为了克服现有常规的
学位
受益于互联网的发展,全世界时时刻刻都会产生大量的文本资源。在这些杂乱无章的文档资源中,其实蕴含着丰富的商业价值,但前提是需要对它们进行有效地组织和管理。面对海量文本,人工处理显然不可取,自动文本分类技术也就应运而生,并成为管理文本信息资源不可或缺的工具。关于文本分类的技术研究,可以说层出不穷。传统文本分类领域中,文本表示方法如独热编码通常具有数据稀疏和维度灾难的问题,而特征提取算法如卷积神经网络则
学位
航天气化炉(HT-L Gasifier)作为干粉煤气化技术的典型代表,拥有完全自主知识产权,是国内煤气化技术的重点研究对象。航天气化炉通过制备煤粉、加压输送、气化反应、合成气洗涤、渣及灰水处理等生产环节,生产制备有效气CO和H2。气化反应是整个生产过程最关键的一环,决定着航天气化炉的运行品质和效率。航天气化炉系统具有多变量、滞后时间长、时变和非线性的特性。目前在气化炉生产过程中,多采用手动控制,受
学位
行人仿真在公共安全研究中具有重要地位,然而如何让仿真个体的行为接近真实是一个难题。将深度强化学习应用在行人仿真领域灵活性高,可扩展性强,模型简单,能够提升仿真真实性,是行人仿真领域一个新的发展方向。当前深度强化学习已经广泛应用于智能体仿真中,但由于相关软件工具的缺乏,导致智能体仿真仍旧停留在质点水平,无法应用到行人仿真领域。近年来随着相关工具的涌现,使得将深度强化学习应用到行人仿真领域成为可能。为
学位
SF_6气体作为优良的绝缘介质和灭弧介质,在高压电气设备绝缘领域得到广泛的应用。但是SF_6气体中微水含量在电弧作用下会分解为具有腐蚀性的物质,严重影响设备绝缘性能和使用寿命,因此对电气设备中气体湿度检测非常重要。目前,国内外电力系统使用的微水检测方法主要有电解法、露点法和阻容法,这些方法不适合在线监测且对被测环境存在限制。而光纤光栅体积小、耐腐蚀和能够实现在线监测,同时微结构光纤具有结构灵活的特
学位
光子晶体光纤表面等离子体共振(Surface Plasmon Resonance,SPR)传感器具有高灵敏度、实时检测、免标记等优点,在化学、生物等领域展现出了巨大的潜力。高性能光子晶体光纤SPR传感器已经成为折射率传感领域的研究热点。为了提高光子晶体光纤SPR传感器的性能(灵敏度、检测限等),本文从光子晶体光纤结构设计以及敏感层的材料选择和微结构设计的角度出发,设计了不同结构的光子晶体光纤SPR
学位
应变是工程领域评估建筑结构健康的重要参数,因此对其进行及时有效的检测非常重要。相较于传统电学传感器,光纤传感器具有耐腐蚀、体积小、抗电磁干扰等优点被广泛应用于应变的测量。然而,微小应变和复杂环境中的应变测量一直是光纤应变传感器的研究热点和难点。本文以锥形结构的光纤为研究对象,对其微应变传感特性进行理论研究。论文首先分析了全光纤在线型马赫-曾德尔干涉型传感器的原理,并利用光束传播法对直锥光纤和S锥光
学位
上世纪五十年代,可编程机器人被开发出来以代替人类执行重复性任务,但是这种初代机器人还不具备移动能力并主要用于工业生产。随着机器人技术的发展与完善,移动机器人开始出现,并逐渐应用于军事、救险、服务和娱乐等诸多领域。然而,当移动机器人用于人类活动的场景中时,传统的导航算法由于未考虑机器人的运动行为对附近行人造成的影响而容易使行人产生不舒适的情绪。因此,建立在传统导航基础之上的社交导航被提出以解决这种问
学位