多智能体系统中的合作规范涌现机制研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:weige1985
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多智能体系统作为一种分析复杂系统的思想方法和工具,在管理和协调各智能体间交流合作方面具有重要的意义。然而,由于参与主体具有自私性和自主决策能力,如何在复杂的场景下快速有效地涌现出合作规范成为系统发展过程中面临的重大挑战。利用计算机技术重现真实系统中的简单主体,提出高效普适的理论模型,让主体在交互过程利用局部信息不断优化自身行为进而涌现出合作规范;并且通过分析仿真结果来认识、理解甚至控制多智能体系统,逐渐成为人工智能和人工社会领域研究的核心问题。本文以多智能体系统为背景,将其发展进程中所面临的问题场景抽象描述为一般性的困境模型,在此基础上进行分析并提出了相应的合作规范涌现机制,主要贡献在于:(1)现有的工作对策略学习规则的研究过于单一,主要依靠收益、信誉等简单的信息设计交互协议,未能充分考虑到主体丰富的认知能力和社会属性,导致提出的理论模型难以准确的描述现实生活中主体真实的复杂行为特征。针对这一问题,本文基于个人影响力提出了带奖惩机制的策略学习规则,该规则中主体的决策行为主要由个体收益和个人影响力这两个属性共同决定。其中,个人影响力主要由调整敏感度和当前策略所持续的时间共同控制,并根据主体的学习行为进行相应的调整。实验结果表明,该学习方法有效的提高了系统整体的合作水平,通过微观分析发现主体间个人影响力的差异是促使合作现象得到改善的主要原因。最后本文验证了小世界网络和无标度网络等复杂网络中的实验现象,研究发现该学习规则能够解决不同复杂网络场景中的困境问题。(2)强化学习已经被证实无法在传统囚徒困境模型中涌现出合作规范,最近基于历史信息进行策略探索的相关研究被证实可以在多策略博弈模型中取得理想的合作效果。针对这一发现,本文提出运用强化学习方法在带剥削的多策略博弈场景下解决合作规范涌现问题。实验结果表明强化学习方法有效的提高了系统的合作水平,并且其提升合作的能力也强于已经被提出的其他策略学习规则。另外,本文阐述了强化学习能够促进合作的原因,揭示了不同类型的智能体在系统发展进程中扮演的角色。
其他文献
2016年政府工作报告中明确提出“发挥大众创业、万众创新的乘数效应,充分释放全社会创业创新潜能”,十九大报告明确提出要加快建设创新型国家的重大战略方针与重要举措。山西省国家资源型经济转型综合配套改革示范区在2016年年底成立,要求深化科技体制改革,确立企业的科技创新主体地位,科技型中小企业的发展迎来了春天。但科技型中小企业从事的是以科学技术上的发明和创造为基础的技术商品化活动,不可避免的存在开发失
在经济全球化发展的背景下,乐歌公司在保持人体工学高新技术企业国内领先地位的同时,也在不断扩张海外市场,合理的企业经营是保证乐歌成功实现并保持国际化经营战略的基本前提。经营的核心是决策,高质量的经营决策是企业经营活动正常运行的基础,是企业经营成功的前提。随着信息技术的飞速发展,数据分析呈现出方法多、运用广、效率高的特点,在现代社会活动、企业经营管理中发挥着十分重要的作用。严谨的数据分析能有效避免传统
铝合金成形工艺广泛应用于汽车行业用于制造车身、面板、底盘等多种零部件,而在成形过程中,加工工件可能会出现回弹、开裂、截面变形等缺陷。为了避免在进行大批量零件生产时出现大范围的零件加工缺陷,需要对弯曲成形工艺进行深入的研究。本文以6061铝合金轧制板材为研究对象,通过INSTRON5966型电子万能试验机对经过固溶处理的6061铝合金板材和人工时效处理1h、2h、4h和8h的6061铝合金板材进行准
当前大学毕业生的就业形势不容乐观,大学生就业难的问题日益突出。大学生就业教育是帮助大学生提高就业竞争力的关键途径,担负着帮助大学生顺利就业的重任。随着“双创”理念的提出,大学生的就业环境将发生变化,就业形式更丰富,职业类型也将更加多元化,这为民族院校就业教育带来了机遇与挑战,更对民族院校就业教育教师的能力提出了更高的要求。那么,当前民族院校就业教育教师的能力现状能否适应新时代的发展需要?民族院校就
随着城市化进程的不断加深,人们的物质生活大大丰富。然而也带来了PM2.5超标、“城市热岛效应”等问题,严重危害人们身体健康的同时也影响了人们的口常生活。传统的室内绿化
随着现代经济和信息技术的迅猛发展,包括互联网在内的网络技术有机地融入了传统的金融领域,形成了互联网金融这一特殊业态。P2P网络借贷能够便捷和高效地实现资金融通,可在一定程度上减轻个人和小微企业在融资方面的困难,能有效缓解中国长期存在的金融拟制问题,所以P2P网贷一经推出便大受欢迎。但在P2P飞速发展的同时,平台风险也在不断积聚,这不仅损害了投资者的利益,而且限制了行业的稳定和可持续发展。因此,本文
图像和视频编辑技术的快速发展使人们能够快捷简单的对图像进行编辑。这类技术具有两面性,一方面,作者团队或者授权方可以利用该技术提高作品的美感和图像质量;另一方面,一些非法分子可以篡改未经授权的图像用于商业目的,损害了原创者的利益,甚至有时改变了图像本身的意义。这种侵权行为不利于营造重视版权,重视创新和重视原创的氛围。本文针对此问题开展图像侵权检测算法研究,设计了相应的算法和系统。设计的算法能够判定待
三维激光扫描技术作为一个新兴的测量技术在测绘行业中占有越来越重要的比重,该技术有着效率高、精度高等优点,在实际的工程测量、道路监测、城市规划中被广泛运用。三维激光扫描技术可以在极短的时间里获取海量的点云数据,但是庞大的数据量给点云的处理带来了诸多不便。如何对点云数据进行压缩而又保留其几何特征信息是一个重要的研究课题。本文主要研究内容如下:(1)通过分析规则格网空间索引、四叉树索引、KD树索引、R树
四旋翼无人机因其性能卓越,价格低廉,且能代替人完成许多危险的,不方便完成的任务,引起国内外许多专家学者的关注。但四旋翼无人机坠毁、炸机现象普遍发生,四旋翼无人机飞行
党的十九大提出要完善干部考核评价机制,建设人民满意的服务型政府。海事局作为水上交通管理和安全监督部门,其工作性质、工作内容等,与陆地交通管理部门及其他政府部门,有着显著差异。建设“人民满意的海事局”,就需要对其公务员绩效进行准确考核、需要依据考核结果对公务员进行合理奖惩。海事局现行公务员考核体系,主要参照一般政府部门的做法,其考核指标与海事部门工作联系不够紧密,考核重点没能体现海事部门工作特殊性等