基于博弈学习的多Agent群体交互行为的研究

来源 :河南师范大学 | 被引量 : 0次 | 上传用户:wangruiqiangkang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
交互行为是人类生活中时刻都在发生的行为,是人类社会中最常见的活动,在日常生活、商贸交易、社会关系、教育教学、政治活动等都有着一定的意义,同时,这也是MAS(多智能体系统)研究的重要内容。随着人工智能、计算机图形学、运筹学等学科的不断发展,借助虚拟现实技术实现群体交互行为的模拟逐渐发展起来。群体交互行为的研究被广泛应用在商贸交易、社会关系、军事模拟等许多领域,对社会发展和人类进步起到了很大的促进作用。对生活中的群体交互行为进行仿真研究,不仅能更好的真实的反映群体交互行为,还能在一定程度上加大人们对群体交互行为的认知,有助于人们处理现实中复杂的群体交互行为。早期的一些学者对群体交互行为研究的方法有:多Agent、博弈论,然而,这些研究存在一定的局限性,有的模拟仿真不真实,有的可能角色缺乏智能性。群体交互行为中的参与者的特征以及参与者的行为策略是研究群体交互行为的主要组成部分,也是反映群体交互行为的关键因素。由此,如何逼真的实现群体交互行为逐渐成为广大学者关注的焦点。本文利用博弈学习思想对群体交互进行研究,主要的做工作如下:(1)对群体交互行为的研究现状进行综述,并分析了这几种方法的优缺点,并提出了一种改进方法。(2)介绍了博弈论、Nash均衡和博弈学习思想,分析了常见的交互模型,在博弈学习思想的基础上进行改进,构建了基于博弈学习的多Agent群体交互模型。(3)在有限理性的基础上,利用博弈学习思想,构建一个多智能体(Multi-Agent)博弈学习协调算法并利用该算法对出行者行为分析修正,实现城市交通路口的畅通,进而实现区域、全局的交通优化,最后通过实例仿真验证其可行性。(4)在上面的博弈学习下的多Agent群体交互模型基础上研究博弈学习思想,构建多智能体(Multi-Agent)交互的博弈学习算法,并利用此学习算法对团队合作小组成员的行为修正,并对博弈学习方法中的学习因子更新实现局部均衡,最终达到全局利益优化。最后通过实例仿真验证其可行性。
其他文献
在研究深空目标检测识别算法时,需用大量不同想定下的红外图像进行反复测试和评估。然而,由于飞行实验受诸多条件限制,很难取得足够的样本数据。为此,深空目标红外光学特性仿
近几年电子商务的蓬勃发展使越来越多的人青睐于网络购物。一方面,为了提高客户满意度,网上商家通常允许客户对他所购买的商品进行评价,导致商品评价的数量迅速增长。另一方面,由
随着科学的发展,技术的进步,智能视频监控系统在数字图像处理及计算机视觉领域中逐渐成为了一个核心课题。而智能视频监控的目标检测与目标跟踪也成为智能视频监控系统的关键底
随着物联网技术的不断发展,RFID系统的安全性也逐渐的被研究者所关注。以往大多数学者针对RFID系统安全的研究都集中在RFID无线通信协议的改进上,而RFID中间件的安全研究也常
随着通信技术、计算机科学技术等高科技的飞速发展,软件产品越来越被开发出来服务于我们的日常生活。软件产品具有不可磨损性、耐老化性、精准性、重复性等优点,人们越来越依赖
无线Mesh网络(Wireless Mesh Network, WMN)是通过无线信号传输数据的多跳网络,它结合了多信道、多网卡、多速率等技术,可以有效地改善网络性能,较传统无线网络有着较大优势
多目标优化问题是现实中普遍存在的优化问题,如果优化目标多于3个,则称为高维多目标优化问题。目标个数增加,一方面给高维多目标优化算法带来极大挑战,另一方面会对高维多目标算
随着企业信息化的深入,越来越多的企业流程需求已经无法用普通的办公自动化系统来满足,在激烈的市场竞争中为了适应复杂多变的市场需求,为了赢得市场、获取利润,企业必须建立
作为一种典型的分布式系统,P2P网络的应用越来越广泛。结构化P2P网络基于一致性散列函数,提供节点、对象资源位置在覆盖网中的位置映射,具有良好的查询效率。但是,结构化P2P网络
近几年来,CMOS图像传感器由于其生产工艺兼容、生产成本较低和功耗控制较好等优势,在很多方面获得了快速的发展,广泛应用于手机、PC摄像头、安防监控、条形码扫描器、玩具、