【摘 要】
:
随着人工智能时代的到来,多智能体与强化学习技术作为其中一部分已经取得了一定的研究与应用,尤其在机器人技术、自动化技术、有人/无人作战、自适应学习等等领域应用广泛。多智能体任务分配问题作为经典问题,也常被应用在资源调度、多机协同、无人机作战等等方面。尽管取得了一定研究成果,但多智能体系统与任务分配仍然面临着基本的困难:个体通信开销大、需求高,个体数量多导致状态空间复杂,个体计算、存储资源有限,建立复
论文部分内容阅读
随着人工智能时代的到来,多智能体与强化学习技术作为其中一部分已经取得了一定的研究与应用,尤其在机器人技术、自动化技术、有人/无人作战、自适应学习等等领域应用广泛。多智能体任务分配问题作为经典问题,也常被应用在资源调度、多机协同、无人机作战等等方面。尽管取得了一定研究成果,但多智能体系统与任务分配仍然面临着基本的困难:个体通信开销大、需求高,个体数量多导致状态空间复杂,个体计算、存储资源有限,建立复杂系统时难以求解等。本文主要探讨的问题是多智能体任务分配问题的极端化情况,将智能体数量进一步扩大,将智能体个体模型进一步缩小。个体数量相对任务至少高出两个数量级,个体模型则缩小至需要小片群体才能够达到单个任务的执行需求量。这种特例性问题模型带来的优点包括:应对未知区域型场景时可以通过投放、抛洒、预埋入等方式达成区域遍布,对于区域中可能出现的任务目标能够产生自然的接近效果;微小型个体体积小、隐蔽性强;个体造价低,可一次性投入;个体的失灵对于整个系统影响微乎其微,使系统具有强鲁棒性。这类问题模型可以应用到诸如电子作战、智能雷场、隐蔽爆破、隐蔽侦查等国防军事化事业,具有一定的实际应用意义,本文所研究内容已有部分成功应用到其中某一领域。针对该问题模型,本文主要研究内容包括以下几方面:1.大规模微型智能体(LSMA)系统的特点及限制当数量剧增,个体体积能力减小,带来的问题是对通信的压力增加,通信强度变大但信息量减少,并且个体获取信息的能力减小。另外,对于一般静态优化与动态学习算法在计算复杂性上存在较大挑战。2.LSMA系统的通信机制设计要解决该特殊问题模型,首先需要建立相关通信机制。本文通过减小信息量、间接信息转换与替代等方式引入了有限信息下的通信机制,为该问题模型建立、求解提供可能。3.结合通信的LSMA任务分配建模在有限信息的通信机制基础上,本文将结合传统多智能体任务分配模型的形式,引入LSMA系统的特点提出LSMA任务分配模型的建立,并通过仿真实验验证预期效果。4.基于两种改进强化学习方法的求解对于分配模型LSMA-TAM,本文通过改进Ant-Q算法的Ant-LQ,与引入规则算法与群体熵的Ant-RELQ两种在线学习算法对该模型进行求解,详细介绍了原方法的限制与不足,阐述了改进思路,给出算法设计并分析优势与不足。5.指标与对照实验对于LSMA任务分配模型,本文提出了6-7种体现算法作用的指标,并与3-4种能够应用的方法进行实验对比,根据实验结果分析体现本文中求解算法改进的有效性,另外指出不足与存在的改进空间。
其他文献
“部编本”初中语文教材在语文核心素养背景下诞生,新教材中出现不少创新点,“活动·探究”单元就是其中之一。“部编本”在八年级上册设置“新闻”、下册设置“演讲”两个“活动·探究”单元,九年级上册设置“现代诗”、下册设置“戏剧”两个“活动·探究”单元。“活动·探究”单元以活动任务单的形式组织课堂内容,共分为三个任务,其基本模式是:文本阅读——实践活动——尝试创作,既不同于综合性学习板块,也不同于一般的阅
采用了文献资料法、田野调查法、访谈法、逻辑分析法等研究方法,历时三年,对江西省樟树、南昌、奉新等地的江西法门拳进行深入研究。理论上从法门拳的起源、形成与发展的历史环境和社会环境进行研究,研究过程中发现关于法门拳的研究现有的文献资料如翎毛凤角,可见江西法门拳的挖掘与整理工作迫在眉睫。在研究期间笔者走访了江西省武术运动管理中心负责人、法门拳申遗工作负责人、武汉体育学院专家和1983年江西武术挖掘与整理
当今社会,产品的质量及可靠性受到越来越多的关注。如何利用相关信息准确地评估产品的可靠度已经成为实际工程中研究的重点问题。与传统的利用产品寿命数据的可靠性评估方法相比较,基于性能退化的可靠性评估方法则更加适用于可靠性高、寿命长以及试验费用昂贵的产品。因为,即使在加速试验的条件下,在短暂的试验周期内也难以获得这类产品的寿命数据。而产品的性能退化数据则可以在产品的运行期内测量得到。近年来,相关学者对基于
大数据时代下,在机器学习和数据挖掘领域,矩阵填充问题越来越受到学术界和工业界的广泛关注。很多学者提出了一些优化算法解决矩阵填充问题,比如奇异值阈值截断方法(Singular
目前,通过界面聚合法制备的聚酰胺反渗透复合膜是反渗透膜的主流产品。由于其基膜和功能皮层是两种不同的材料,则可通过对各部分采取分别优化的方法提高复合膜的性能。本文主要以基膜性质和功能皮层的制备条件为出发点,分别探讨基膜性质及界面聚合工艺参数对反渗透复合膜性能影响。并通过等离子体改性优化基膜性质及优选界面聚合条件提高反渗透复合膜性能。首先直接在聚砜(PS)基膜上界面聚合制备反渗透复合膜。研究界面聚合工
伴随各式无线通讯技术的演进,对功率放大器(PA)的要求也水涨船高,其主要挑战是要支持不断增加的频率和模式。出于集成度和制造成本的考虑,传统的一个频段搭配一颗独立的功率
异喹啉与吡啶衍生物是重要的含氮杂环化合物,普遍存在于天然产物和生物分活性子中,也是很多具有生物活性和药物活性分子的关键母核结构。另一方面,过渡金属催化C-H键膦化反应是一类新型的有机反应,近年引起了化学研究者的广泛兴趣,本论文围绕这两点展开了研究。本论文主要内容包括三个部分:(1)综述了近年来运用各种方法实现化合物膦化及合成吡啶衍生物的研究进展。(2)发展了铜催化的异喹啉N-imino与膦酸酯C-
布票曾经是计划经济环境下人民获取生活必需品的重要凭证,由国家商业部门统一印制发行,专门用来购买棉布、棉制品纺织品、棉制品,是计划经济体制的典型产物。布票的诞生,是中国对布匹购销实行统一管理及保证布匹按计划供应所采取的一项措施。棉布定量凭票供应制度从1954年开始实行。政务院规定,由各省、自治区、直辖市商业部门印发。因特殊情况,需要异地使用布票时,需到指定地点兑换异地通行票证。特供军用的布票由国家统
随着Web服务应用的普及,Web服务的数量呈指数级增长,Web服务作为一种可重用、松耦合的分布式计算模型受到了广泛关注。服务市场的不断出现进一步促进了服务资源的利用和发展。如何从数以万计的Web服务中快速准确的查找出自己需要的Web服务已成为学术界甚至工业界的研究热点。Web服务往往存在着服务描述语义稀疏,表达模糊的问题,这种语义稀疏的现象会导致无法进行有效的相似度计算。当前Web服务发现方法主要
ZigBee作为一种全世界流行的通信技术,其具有成本低、功耗低、容量大的特点,而工作在2.4GHz频段的ZigBee技术拥有最高250kb/s的传输速率,传输距离达到上千米。由ZigBee芯片组