基于协作的多智能体系统设计与优化技术研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:lllll15
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会经济的进步和计算机技术的发展,人工智能技术的推动和变革日新月异。在现今高性能计算与人工智能算法的推动下,多智能体系统(MAS)作为分布式人工智能的主要分支之一,已经广泛应用于机器学习、社交网络、金融网络、经济演化与博弈论等领域,包括但不限于计算机科学、生物学、医学、经济学和心理学。MAS已成为解决大规模复杂系统任务及相关模拟与分析的首选。智能体在MAS中所特有的自利性、社交性、反应性、预动性以及较高的问题求解效率为社交网络应用、工程调度、路径规划与避障等实际应用问题的解决开辟了新的视角。根据不同的应用领域以及实际问题,MAS设计具有相当的灵活性而使得MAS呈现出多种类型,但无论MAS的类型是何种结构,多智能体之间的协作功能都对MAS的目标实现和求解过程起到了至关重要的作用。MAS在多种组织形式(如联盟形式、小组形式和会众形式)下的执行效率和相关性能都依赖于智能体协作机制的设计,而在处理不同的大型复杂问题时的诸多约束条件和应用规则给MAS的模型设计和协作优化带来了新的挑战和要求。为提高MAS解决相关实际问题的效率、性能和可扩展性,本文针对基于协作的多智能体系统的设计与优化技术进行了深入研究,主要工作和创新点如下:(1)研究了动态复杂网络下多智能体的合作优化问题。针对复杂网络中不断变化的连接,为多智能体的合作设计了一种动态的联盟合作机制,补足了现有的技术无法应对动态环境下的多智能体合作的缺陷。在动态复杂网络中,该合作机制基于智能体资源交换的背景,在智能体的资源买卖博弈中实现了动态的智能体联盟合作。该动态机制的核心思想是利用“强者”概念对核心的关键智能体进行动态计算和更新,智能体在每轮博弈迭代下,都会根据关键智能体的变化和对自身环境的评估而动态的改变自己的联盟状态,从而使得最终的MAS团体合作收益达到最高水平。(2)研究了协作环境中多智能体系统的多任务分配和优化问题。多智能体系统中的多任务分配旨在高效率、高成功率地完成任务,同时获得相应的任务奖励,推动整个系统的高效运行。大多数现有的任务分配方法缺陷主要集中在:1)无法平衡智能体的奖励分配和任务执行的成功率;2)忽略了联盟合作完成任务的稳定性。这样的缺陷极易导致任务的执行率低下和任务分配的失败。而缺乏联盟调度的任务分配方法往往不能对已经分配的任务制定执行顺序,导致总的任务执行时间变长和引起智能体冲突而使得任务执行失败。对此,首先提出了一种高效的基于联盟稳定性的量子粒子群算法(SQPSO),并辅以历史任务集计算相似任务,使得任务分配能保证智能体的奖励获取、奖励分配和执行任务的联盟稳定性以及搜索最佳联盟的速度。在SQPSO计算出的分配结果基础上,设计了有效的联盟调度算法(EQPSO),其特有的联盟相似性的判断,可以帮助制定最佳的调度策略,用以减少联盟的建立时间,提高任务集总的完成时间。SQPSO和EQPSO算法的两步计算使得MAS中多任务分配问题的求解过程和解决方案得到了优化。(3)研究了协作型多智能体系统中任务分配问题下的任务拆分和多目标优化分配问题。针对MAS中的任务划分和多目标分配问题,构建了一种新颖的分层MAS模型,并通过深度学习和多目标优化的方法使得任务的拆分和分配得到了解决和优化。分层MAS模型为任务的划分和重组以及多目标的任务分配提供了基础。在第一层,引入了深度Q学习拆分算法来选择需要拆分的任务,经过任务的拆分和合并过程来简化原始任务集的复杂优先级关系。在第二层,提出了改进的基于位移的密度估计方法(MSDE),用于MSDE-SPEA2-based算法的种群筛选过程。MSDE-SPEA2-based算法实现了对任务分配的多目标优化,包括任务分配的makespan、智能体满意度、资源利用率、任务完成度和任务等待时间五个目标,并同时解决了任务的分配和调度。(4)研究了不稳定网络连接下多智能体系统的影响力传播优化问题。从智能体合作交互的角度,在MAS上对影响力传播最大化(IM)问题进行建模,并集合图嵌入的思想和方法解决不稳定连接下MAS模型的IM问题。首先提出了不稳定连接的定义和概念,细化了不稳定连接的MAS影响力传播问题的定义。其次基于问题的定义设计了MAS的IM模型,包括不稳定连接的可用性实现方式和两种新的传播模型。然后基于问题和模型设计了智能体交互算法,细化了智能体的交互规则和信息传递。最后,提出了Unstable-Similarity2vec(US2vec)算法对不稳定连接下的节点进行信息嵌入,并以此结果提出种子节点选择(CA)算法,实现了基于MAS的不稳定连接上影响力的传播优化。本文作不仅具有一定的理论价值,丰富多智能体系统几个方面的优化和设计,而且推动了这些理论的实用化进程,具有相当的应用价值和实际意义。
其他文献
经济法的学习内容相对枯燥,为了让学生对知识点理解得更加透彻,需要教师适当引入相关案例,为学生搭建分析问题和解决问题的平台,从而避免填鸭式的理论教学,增强学生的法律理解与应用能力。本文通过分析案例教学法的优点,阐述了案例分析法在经济法教学中的应用方法。
目的 研究减重活动平板联合PNF技术对偏瘫儿童步态训练中平衡功能的影响,为临床上的偏瘫儿童提供参考,以改善偏瘫儿童的步态训练。方法 选取2017年1月—2020年1月昆明市儿童医院收治的偏瘫患儿200例,按照完全随机法分为PNF技术组和联合组各100例。PNF技术组患儿使用PNF技术训练,联合组患儿使用减重活动平板联合PNF技术训练,评价患儿步态训练参数值、偏瘫侧膝关节位置觉、运动觉、GMFM-8
细胞是生命体形态结构和功能活动的基本单元,实现着物质代谢、能量转换和信息传递等一系列生命过程。原始细胞模型(Protocell)是一种人造细胞,是人们对地球最原始生命的设想,拥有最简单、最原始的腔室结构。原始细胞具有制备相对简单、结构相对稳定等优势,有望代替功能障碍的真实细胞,在细胞生物学、化学生物学和生物医学方面具有潜在的应用前景,并且原始细胞研究将为生命起源提供理论与实验依据。然而目前原始细胞
近年来,资源描述框架RDF(Resource Data Framework)已被广泛应用于各种网络资源标记应用中。在RDF模型中,现实世界中事实都被表示成三元组形式。一个RDF数据集天然地可以被视为一个图,也就是知识图谱,其中主体和宾语是顶点,每条三元组是一条边,而谓语就是这条边上的标签。随着RDF模型被广泛地应用,现有知识图谱数据集规模也越来越大。于是,如何利用各种分布式计算环境对大规模知识图谱
日益突出的能源短缺和环境污染问题严重制约着人类的可持续发展。光催化析氢技术通过将太阳能转化为化学能是缓解能源危机的有效途径之一。石墨相氮化碳(g-C3N4)由于其独特的电子、能带结构和化学稳定性,被认为是最具有前景的光催化析氢材料之一。然而,g-C3N4由于其比表面积小、光生载流子易于复合、可见光利用率不高和表面活性位点数量不足等问题,导致光催化效率低。针对这些问题,本文通过构建异质结结构、掺杂异
社会主义核心价值观,承载着中华民族和国家的精神追求,是实现中华民族文明进步、推动国家发展壮大最持久最深沉的力量。公民是弘扬和践行社会主义核心价值观的历史主体与基本力量。如何培育契合国家和社会需求的公民核心价值观念,是值得研究的大问题、真问题。作为公民层面的社会主义核心价值观,“爱国、敬业、诚信、友善”为每个社会公民提供了基本的道德规范和行为导向。榜样文化作为社会主义先进文化的重要组成部分,是公民层
水稻作为我国第一大粮食作物,土壤的盐渍化是近年来威胁水稻产量的重大因素。土壤盐渍化对植物带来的伤害最主要是由于高浓度的盐分带来的渗透胁迫、离子胁迫、以及伴随的氧化胁迫,如果能开发和创制耐受盐胁迫的水稻新品种,就可以利用盐碱化的土地。根据结构域分析,植物中的类受体蛋白激酶(Receptor-like kinases,RLKs)是具有胞外配体结合结构域、跨膜结构域和kinase激酶域组成是酶偶联受体,
电涡流阻尼是一种利用电磁感应现象产生的新型非接触式阻尼,相较于传统的粘滞阻尼和摩擦阻尼,电涡流阻尼具有无工作流体、维护少、寿命长、灵敏、可靠等优点,在振动控制领域具有广阔的应用前景,但土木工程结构振动具有速度低、质量大等特点,需提高电涡流阻尼的耗能效率。齿轮和齿条的组合可对电涡流阻尼的耗能效率进行有效放大,且为成熟的工业产品,性价比高、可靠性好,同时可根据实际需求输出惯性力,为结构振动控制提供新的
随着计算机技术的快速发展,计算机网络也随之大规模的飞速发展。在大规模网络中,网络的性能状况越来越被引起重视,如果对网络进行全网测量来获得网络性能状态,一方面会给网络带来额外的负担,影响本身的网络环境,另外一方面,对大规模网络进行全网测量消耗的时间会很长,使得很难快速掌握全网状况。基于稀疏表征的填充技术利用网络本身有的冗余性,使得仅仅需要通过测量部分数据,就能推断出全网数据。本文基于稀疏表征技术,从
结构可靠性定义为结构在规定时间内和规定条件下,完成规定任务的可能性。由此可见时间是影响结构可靠性的一个重要因素。实际工程中,结构因腐蚀、磨损或老化等因素,会出现性能随时间延长而衰减情况。此外,结构往往承受随时间变化的随机动载荷。这两个因素使得结构的响应随时间的变化而变化,结构的可靠度随时间的延长而降低。然而传统的静态可靠性分析忽略了时间这一重要因素,导致模型过于简化,所计算得到的静态可靠度过于乐观