基于混合种群的种间交互博弈动力学研究

来源 :云南大学 | 被引量 : 0次 | 上传用户:sxsj002
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现实世界中存在大量群体智能行为,如捕食者协同围捕、沙丁鱼洄游、无人机编队系统,这些群体智能行为是自然界和人类社会赖以生存和稳定运行的基础。如何揭示群体智能行为的涌现机理和激发机制,成为近年人工智能领域最具挑战性的科学难题之一。演化博弈论作为行为决策研究的基础理论,为定量刻画群体智能行为中个体行为决策规律、分析预测群体智能行为提供了有效的研究工具,得到了学术界的广泛研究和应用。然而,随着人工智能时代的到来,群体智能行为日趋呈现出复杂多变的特征,传统的演化博弈论已经难以准确刻画动态、时变、非完全信息环境中群体策略的学习、演化规律。因此,如何通过信息科学、网络科学、数据科学等多学科交叉,揭示群体智能行为的动态演化规律是群体智能研究的发展趋势之一。本文以演化博弈论和复杂网络为基础,提出了两种基于混合种群的行为决策模型,主要包括以下两个方面:(1)提出了基于混合决策机制的种群博弈模型。虽然基于策略模仿的演化博弈论和基于强化学习的博弈动力学都可以用复制动力学来建模,但两种动力学的内在机制是完全不同的。我们介绍了一种新的博弈模型,它考虑了这两种动力学的混合。也就是说,一些智能体是演化博弈玩家,而另一些则是强化学习玩家。我们发现合作水平与强化学习智能体的比例有关,呈驼峰形状。这是因为两种智能体在演化过程中扮演着不同的角色。强化学习玩家从环境中学习互惠,并作为促进演化博弈玩家合作的媒介。另一方面,由于背叛不再是主导策略,演化博弈玩家变得更加合作。我们通过对近似方法对混合动力学进行建模,其结果与蒙特卡罗模拟的结果一致。(2)提出了基于网络耦合机制的种群博弈模型。以相互依赖网络的耦合机制为核心,研究了一个由保守驱动的玩家和激进驱动的玩家组成的异质群体的行为决策。保守型驱动的玩家保持稳定的耦合强度,最大限度地减少个人风险,避免过度冒险的个人选择,而激进型驱动的玩家打破刻板印象,自主调节耦合强度以获得高回报。与以往研究合作水平的单调增长不同,该模型显示了种群合作水平与保守玩家密度之间的驼峰关系。此外,在某些情况下,这些异质种群没有适当的竞争,但它们形成战略联盟以获得更好的演化结果。进一步分析表明,耦合强度的极化增强了合作。
其他文献
<正>近年来,大型语言模型技术不断飞跃,海内外互联网企业在人工智能领域的技术开发及迅速扩张为大语言模型的技术进步与应用落地开拓蓬勃发展的空间。1.大型语言模型的定义及特征大型语言模型(Large Language Model,LLM),即利用大规模语料数据进行预训练的预训练语言模型(Pre-trained Language Models,PLMs),是自然语言处理(Natrual Language
期刊
随着群体智能的广泛应用,多智能体强化学习已成为目前的一个重要研究课题。在多智能体强化学习中,智能体通过强化学习的反馈机制来学习最佳策略。大规模智能体之间的动态交互以及非确定性的环境,导致了多智能体强化学习的复杂性。在学习过程中,很难预测智能体的最佳行为决策。对多智能体系统建立动力学模型,可以定性地洞察系统的演化,帮助理解智能体的行为决策。由于智能体数量带来的计算空间维度爆炸以及动态交互的复杂性,目
学位
为实现国家的战略目标,成都市深入贯彻习近平总书记对四川及成都工作系列重要指示精神,落实关于国资国企改革发展和党的建设的重要论述,不断深化改革重塑国有企业发展动力,在抢抓作为推动国家形成新发展格局的重要支撑的成渝地区双城经济圈,建立健全市场化经营机制,增强企业活力和竞争力上,已经探索出了适合自身的具有地方特色的市场化改革之路。X集团2006年成立至今,虽然在经营管理上取得了小有的成就,但存在的问题依
学位
博弈主体在不同维度上具有异质性的非对称博弈更契合现实世界的状态。因此,探索非对称博弈主体的群体合作行为演化的微观机理有着非凡的现实意义和研究价值,可以帮助理解和解决社会困境。演化博弈论作为有限理性个体通过重复博弈自适应学习以达到演化稳定策略的理论方法,为研究群体合作行为决策规律给予了强有力的支撑。本文利用演化博弈理论,结合复杂网络模型和经典的公共物品博弈模型,分别构建了个体非对称属性和道德的两种不
学位
智能家居自动化系统是指通过物联网远程监测和管理各种装置,通过布置家庭网络以及使用者的个性化要求,完成对所有家居设备的管理以及信息的反馈。物联网环境下,设备的增加使得用户经常关注这些系统执行复杂或组合任务的能力。现有的中文智能家居自动化系统只能执行一些无法满足用户需求的简单任务。由于需要学习大量的编程知识,用户很难使用可视化编程系统开发他们需要的家庭自动化系统。同时,无需用户操作的自动编程只能编写几
学位
近年来,区块链作为处理信任问题的重要技术,在金融、食品安全和交通等多个领域表现出重要的前景。共识机制作为区块链技术底层的核心部分,当前公有链使用的共识机制以工作量证明(PoW)和股权证明(PoS)为主。然而这些共识机制仍存在挑战,例如:PoW在效率与去中心化之间,以牺牲效率来获得更高的去中心化来满足公有链的根本需求,并且存在高时延低吞吐问题。PoS由于权益掌握在少数人中,所以导致了明显的中心化趋势
学位
确定药物副作用的发生频率是药物研发和药物风险-效益评估的关键问题。准确、高效地预测药物的副作用频率,对降低药物安全问题发生概率、保护患者健康有重要意义。药物的副作用频率通常在随机对照临床试验中确定,但此方法性能有限且成本昂贵。随着药物临床试验数据的增加,使得基于数据驱动的计算方法研究药物副作用成为可能。现有的药物-副作用相关预测工作主要研究药物-副作用间的关联关系。与此不同,本文旨在探究药物-副作
学位
软件缺陷对软件的质量和经济影响重大,国外研究表明,每年由于软件缺陷造成的损失就达到上百亿元。因此如何准确、高效的发现软件缺陷,减少软件缺陷带来的损失,是软件工程领域一个热门的研究方向。研究人员开始对软件缺陷的可能性、数量、严重程度、分布规律等进行预测分析,发现软件缺陷与软件开发过程中的代码度量元有关。虽然关于软件缺陷的研究从未停止,但是在实际应用中仍然面临预测结果可解释性差,难以取得开发人员的信任
学位
中小学教师职称聘后管理是教师职称制度中的重要组成部分,是职称评聘制度得以持续发挥激励作用的重要环节,对建设高质量教师队伍具有重要意义。本文把深圳市南山区公办学校教师为研究对象,使用文献法、问卷调查法等研究方法,通过查阅文献、梳理国家和地方有关聘后管理的政策现状,调查分析南山区聘后管理的实施现状,分析聘后管理的影响因素,总结南山区聘后管理存在的问题及其成因,最后提出完善聘后管理的对策。通过问卷调查,
学位
近年来,神经网络展现了强大的性能,被广泛应用到了图像识别、自然语言处理、自动驾驶等领域。然而,最近的研究表明:神经网络在面对对抗样本的表现却不尽如人意。人们提出了不同方法来减轻对抗样本带来的危害,这些方法大致可以分为三类:第一类是增强模型自身的鲁棒性,对抗训练便是其中常用的方法,此类方法需要对原有模型进行重新训练或微调,防御成本较大;第二类是在原有模型之前增加附加模块,以此去除或破坏精心设计的扰动
学位