论文部分内容阅读
随着社会经济的进步和计算机技术的发展,人工智能技术的推动和变革日新月异。在现今高性能计算与人工智能算法的推动下,多智能体系统(MAS)作为分布式人工智能的主要分支之一,已经广泛应用于机器学习、社交网络、金融网络、经济演化与博弈论等领域,包括但不限于计算机科学、生物学、医学、经济学和心理学。MAS已成为解决大规模复杂系统任务及相关模拟与分析的首选。智能体在MAS中所特有的自利性、社交性、反应性、预动性以及较高的问题求解效率为社交网络应用、工程调度、路径规划与避障等实际应用问题的解决开辟了新的视角。根据不同的应用领域以及实际问题,MAS设计具有相当的灵活性而使得MAS呈现出多种类型,但无论MAS的类型是何种结构,多智能体之间的协作功能都对MAS的目标实现和求解过程起到了至关重要的作用。MAS在多种组织形式(如联盟形式、小组形式和会众形式)下的执行效率和相关性能都依赖于智能体协作机制的设计,而在处理不同的大型复杂问题时的诸多约束条件和应用规则给MAS的模型设计和协作优化带来了新的挑战和要求。为提高MAS解决相关实际问题的效率、性能和可扩展性,本文针对基于协作的多智能体系统的设计与优化技术进行了深入研究,主要工作和创新点如下:(1)研究了动态复杂网络下多智能体的合作优化问题。针对复杂网络中不断变化的连接,为多智能体的合作设计了一种动态的联盟合作机制,补足了现有的技术无法应对动态环境下的多智能体合作的缺陷。在动态复杂网络中,该合作机制基于智能体资源交换的背景,在智能体的资源买卖博弈中实现了动态的智能体联盟合作。该动态机制的核心思想是利用“强者”概念对核心的关键智能体进行动态计算和更新,智能体在每轮博弈迭代下,都会根据关键智能体的变化和对自身环境的评估而动态的改变自己的联盟状态,从而使得最终的MAS团体合作收益达到最高水平。(2)研究了协作环境中多智能体系统的多任务分配和优化问题。多智能体系统中的多任务分配旨在高效率、高成功率地完成任务,同时获得相应的任务奖励,推动整个系统的高效运行。大多数现有的任务分配方法缺陷主要集中在:1)无法平衡智能体的奖励分配和任务执行的成功率;2)忽略了联盟合作完成任务的稳定性。这样的缺陷极易导致任务的执行率低下和任务分配的失败。而缺乏联盟调度的任务分配方法往往不能对已经分配的任务制定执行顺序,导致总的任务执行时间变长和引起智能体冲突而使得任务执行失败。对此,首先提出了一种高效的基于联盟稳定性的量子粒子群算法(SQPSO),并辅以历史任务集计算相似任务,使得任务分配能保证智能体的奖励获取、奖励分配和执行任务的联盟稳定性以及搜索最佳联盟的速度。在SQPSO计算出的分配结果基础上,设计了有效的联盟调度算法(EQPSO),其特有的联盟相似性的判断,可以帮助制定最佳的调度策略,用以减少联盟的建立时间,提高任务集总的完成时间。SQPSO和EQPSO算法的两步计算使得MAS中多任务分配问题的求解过程和解决方案得到了优化。(3)研究了协作型多智能体系统中任务分配问题下的任务拆分和多目标优化分配问题。针对MAS中的任务划分和多目标分配问题,构建了一种新颖的分层MAS模型,并通过深度学习和多目标优化的方法使得任务的拆分和分配得到了解决和优化。分层MAS模型为任务的划分和重组以及多目标的任务分配提供了基础。在第一层,引入了深度Q学习拆分算法来选择需要拆分的任务,经过任务的拆分和合并过程来简化原始任务集的复杂优先级关系。在第二层,提出了改进的基于位移的密度估计方法(MSDE),用于MSDE-SPEA2-based算法的种群筛选过程。MSDE-SPEA2-based算法实现了对任务分配的多目标优化,包括任务分配的makespan、智能体满意度、资源利用率、任务完成度和任务等待时间五个目标,并同时解决了任务的分配和调度。(4)研究了不稳定网络连接下多智能体系统的影响力传播优化问题。从智能体合作交互的角度,在MAS上对影响力传播最大化(IM)问题进行建模,并集合图嵌入的思想和方法解决不稳定连接下MAS模型的IM问题。首先提出了不稳定连接的定义和概念,细化了不稳定连接的MAS影响力传播问题的定义。其次基于问题的定义设计了MAS的IM模型,包括不稳定连接的可用性实现方式和两种新的传播模型。然后基于问题和模型设计了智能体交互算法,细化了智能体的交互规则和信息传递。最后,提出了Unstable-Similarity2vec(US2vec)算法对不稳定连接下的节点进行信息嵌入,并以此结果提出种子节点选择(CA)算法,实现了基于MAS的不稳定连接上影响力的传播优化。本文作不仅具有一定的理论价值,丰富多智能体系统几个方面的优化和设计,而且推动了这些理论的实用化进程,具有相当的应用价值和实际意义。