异步切换多智能体系统的协同输出调节探讨

来源 :科技风 | 被引量 : 0次 | 上传用户:appconfig
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:本文对于系统模态不匹配的异步切换多智能体系统的输出调节问题进行了分析与探讨,结合粒子群算法等多智能体系统的优化算法对于分布式输出反馈控制协议进行了设计,从而能夠有效地做好输出调节的工作,为其进一步发展打下了坚实的基础。
  关键词:异步切换多智能体系统;输出调节问题;分析;探讨
  输出调节问题近年来已经取得了很多成果, 输出调节的目标是为不确定受控系统设计控制律使得闭环系统渐近稳定, 且在存在扰动时闭环系统的输出可以渐近地跟踪参考输入或渐近地抑制干扰信号。多智能体系统一致性问题受到了很多学者的关注,一致性问题可以看作输出调节的一类特殊问题, 同理, 多智能体的一致性问题也可看作多智能体协同输出调节问题的一类特殊问题。
  1 多智能体系统的优化算法分析
  粒子群算法,缩写为 PSO。PSO 算法属于进化算法的一种,和模拟退火算法相似,它也是从随机解出发,通过迭代寻找最优解,它也是通过适应度来评价解的品质,但它比遗传算法规则更为简单,它没有遗传算法的“交叉”和“变异”操作,它通过追随当前搜索到的最优值来寻找全局最优。这种算法以其实现容易、精度高、收敛快等优点引起了学术界的重视,并且在解决实际问题中展示了其优越性,粒子群算法是一种并行算法,其源于对鸟群捕食的行为研究 目前很多学者都对多智能体系统生成进行了深入研究,取得的研究成果也是众多的。在本文中对于个体适应值以多智能体系统数据进行有效模拟,以此方式使得程序运行时间得以有效控制,故此,进行多智能体系统数据生成时,仅需利用较为基本的方法即可,由于在被测程序中,所对应的目标路径并不是唯一的,而每次算法运行,仅能够对其中的一种路径进行测试,由此得到对应路径的多智能体系统数据,因此路径数量对应着算法需要进行的次数。首先,要求能够得到一定的多智能体系统数据,可将程序进行插装以获得真实适应值,由此得到实验需要的样本数据。随后,通过样本使得多智能体系统数据得到训练,当训练完成之后以这些多智能体系统数据来对个体适应值进行大致评估,从中选择优秀的个体,即那些具有较好适应值的,随后进行程序运行以此方式从中得到实际的适应值水平。此外,因为在本文方法中对于个体适应值是以多智能体系统数据进行的评估,故此,如果目标路径是相同的,只需要在初始阶段对多智能体系统数据进行训练,在后期的运行中是无须对其进行更新的。
  2 分布式输出反馈控制协议设计
  一般在这样的框架下,可以实现较好的优化功能,主要包括评价模型和执行三个部分,这三个部分主要在于能够实现完整的评价改善循环,评价模块可以评估执行模块的实际效能,对于代价函数进行优化与修正,执行模块可以产生实际的动作来对所改进的策略进行执行,同时也能有效的对于被控对象的情况进行反应,将其进行运行之后,可以通过不同的反馈,来对实际评价与运行的情况进行确定,同时,利用相关的神经网络、强化学习等算法,来实现函数的近似与优化,这样就能对于系统的内部参数进行实时的更新,这里主要是采用贝尔曼的优化方式来进行更新的。效用函数可以对于函数输入在系统内产生的效果,进行合理有效的评估,主要有以下这些方式:通过代价函数的定义情况,我们可以对效用函数做出一定的评价,我们可以看出,当到时候,效用函数的重要性是一样的,当折扣因子减小的时候,这个自适应系统就可以在越短的时间内进行收敛,得到一个更加优化的结果,但是当折扣因子如果过大的时候,系统的幅度就很难进行控制,所以这个时候,我们应当尽量的提高学习率。学习率一般是在0到1之间的,学习率可以直接反映这个系统的学习速度,但是学习率如果太大的话,就可能会导致整个系统的震荡过于严重,但是学习律太低又使得它的收敛的速度太慢了,导致整个的训练时间太长,无法满足实际的要求,因此在符合实际要求的情况下,尽量增大学习率,这样就可以提升学习的速度,同时避免出现严重的震荡情况。
  分布式输出反馈控制协议方法是通过强化学习,来对传统的动态规划进行优化,然后可以有效的解决离散系统和非线性系统中出现的问题,主要包括策略迭代和直接在两种形式,策略迭代主要是通过策略评价与改进的方法,对每一步的策略进行评估,来不断的寻找优化的策略,同时对其进行改良和优化,得到新的权值,生成新的优化函数进行计算,在这个过程当中,评估和改进是循环进行的,最后将会得到一个最优的控制策略。但是需要注意的是,在最好的运行模式下,相关的一些外部参数条件应当是稳定的,这是非常重要的,如果没有这个条件,就会导致整个策略评估,出现一些意外的情况。值迭代的算法主要是针对于一些方程式的计算,通过最优函数的寻找与控制计算,就能计算出最优的值,它不需要进行控制策略的稳定化,在我们的使用当中必须要注意,无论是迭代策略还是值迭代,都需要对于被控对象的相关特性,尤其是内部特性进行研究,这也是分布式输出反馈控制协议的核心特点。
  策略迭代的算法可以根据每一步的执行情况,来对策略进行迭代性的优化,主要是通过每一步的代价函数来对于当前情况的优化情况进行分析,根据目前策略下系统的运行方式,来对于新的代价函数进行求解,进行不断的迭代,最终得到最优化的全局的结果。
  3 总结
  在每次处理更新中对于最优的控制函数进行重新的计算,通过求函数最小值的方法来尽量得到优化的控制方案。主要可以通过对于贝尔曼方程进行求导而得到最优解,同时每次迭代算法几乎都是一样的,需要通过对计算对象的内部动态特性来进行有效的控制与计算,这样才能使得最终的结果符合于实际的优化情况。
  参考文献:
  [1]王传锐.多智能体系统分布式跟踪控制问题研究[D].中国科学技术大学,2014.
  [2]丁磊.不同数据触发机制下的多智能体系统一致性及H_∞滤波[D].大连海事大学,2014.
  [3]金元日.不确定通信下多智能体系统的一致性[D].浙江大学,2013.
  [4]刘学良.多智能体系统协调控制中的若干问题研究[D].华南理工大学,2012.
其他文献
摘要:鸡球虫病是鸡常见且危害十分严重的寄生虫病,其病原为艾美尔科艾美尔属的病虫,主要寄生于鸡的盲肠、十二指肠以及小肠当中,其中寄生于小肠中的柔嫩艾美尔球虫的致病力最强,鸡的死亡率可达80%,给养殖户及农牧民造成了极为严重的经济损失。本文就鸡感染球虫病的危害性、临床诊断方法以及预防措施进行研究探讨,希望减少农牧民及养殖户的经济损失,增加其经济收入。  关键词:鸡球虫病;临床诊断方法;危害;预防措施 
研究性学习自上一世纪八十年代以来在世界风行,99年我国上海率先探究实验后又确立为新的课程标准而为广大教育界同仁重视和推崇,在一些方案和课堂上也出现了成功和精彩的一页
摘要:在高校教学过程,体育教学属于主要环节之一,在高校进行体育教学时,通常将培养学生体育能力与运动技巧作为重点,确保学生养成良好锻炼习惯。在现代教育教学中,传统的体育教学模式存在着不少问题,影响着教学质量。然而,基于现代教育技术的体育教学模式出现,极大的弥补了传统教学中的不足之处。基于此,本文对该教学模式展开详细、具体的分析与探讨,旨在提升体育教学水平。  关键词:现代教育技术;高校体育;教学;应
摘要:本文利用有限元法研究了挖掘机平台结构和回转液压仿真系统,并提出了相应的优化策略。  关键词:挖掘机平台;有限元;回转液压系统  近几年来,随着我国技术的不断发展,液压挖掘机得到了突飞猛进式的发展。而由于社会与市场的发展,对于液压挖掘机的需求量增多,人们对于液压挖掘机的性能要求也有所提升。这就使得对于挖掘机的结构和功能进行研究与改进成了相关技术人员的重要工作。有限元法是一种能够分析挖掘機结构强
对于在使用压力容器过程当中可能出现的问题以及压力容器本身存在的质量缺陷将影响整个压力容器的的工作以及压力容器的稳定性能,也会给人们带来安全问题。因此探讨和研究压
摘 要:文章从企业管理的角度出发,阐述了现代企业统计的分析功能、信息功能以及管理功能。对这三个功能进行系统全面的分析与探讨,探究现代企业统计功能设计及实现,以此促进我国企业统计的实践与理论更好的发展。  关键词:企业统计功能;设计;实现  所谓统计功能则是指对企业进行一种数据的处理工作,统计功能对企业发展具有重要的影響,可以说统计功能直接影响着企业的发展状况。随着时代与社会的不断发展,对企业的管理
摘要:“两学一做”学习教育以来,中煤集团大屯公司孔庄煤矿党委紧紧围绕“两学一做”关键在做的精神实质,在全矿党员中开展“选择并做成一件事”活动,帮助党员树立工作目标、选择工作路径、解决工作问题,推动党员学习教育向普遍性、经常性延伸。  关键词:党员;选择;做成  “两学一做”学习教育是继党的群众路线教育实践活动、“三严三实”专题教育之后,深化党内教育的又一次重要实践,是推动学习教育从领导干部这个“关
摘 要:中高职衔接是构建现代职业教育体系进程中重要的组成部分,课程衔接又是中高职衔接中的重點问题,如何提高汽车检修专业课程衔接的有效性,切实增强中职学生的专业技能水平,培养适应现代产业发展的人才具有重要的意义。  关键词:中高职衔接;汽车检修;教学方法  一、绪论  随着汽车新技术的不断发展和人们对汽车需求量的日益增加,汽车检修专业高技能人才变得炙手可热,各4S店及汽车修配制造厂对人才的需求也产生
摘 要:油气是国家战略资源、经济命脉。培养出高素质应用型人才并输入到我国石油工业体系中,对国家发展至关重要。当前我国石油教育明显同质化,学生培养和行业需求结合不紧密,学生、学校、石油公司之间信息不对等。本文从用人单位需求入手搜,分析单位需求,然后制作相应的网站系统,使单位筛选出自己所需要的人才。  关键词:油气;人才;网站系统  当前我国石油教育明显同质化,学生培养和行业需求结合不紧密,学生、学校
摘要:提升应用能力,是技校生对计算机学习的追求,也是技校生存在于学校的原因之一。但是,就目前的情况来看,技校生的计算机应用能力并没有得到有效的培养。基于此,文章就以技校生计算机应用能力培养的现状分析为出发点,并展开相关内容的具体论述。  关键词:技校生;计算机;应用能力;培养策略  学生是课堂上的主体,计算机教师如果不顺着学生的学习情况进行教学调整与方法变更,那教师的教学效率和学生的应用能力要依靠