不完全信息下的分布式纳什均衡寻找策略

来源 :山东大学 | 被引量 : 0次 | 上传用户:BluePrince
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
博弈的实质在于决策,而决策所依据的指标是优化。本文主要在多玩家非合作博弈的理论框架下,考虑分布式Nash均衡求解问题。一般来说,多玩家非合作博弈系统主要包括:玩家集合,玩家系统以及每个玩家的收益函数。每个玩家的收益函数与其它玩家的状态息息相关,正是由于这种相关性,产生了多玩家互动。非合作博弈系统下的多个玩家在进行互动时,需要考虑三个问题:其一是观察游戏的状态以及环境信息;其二是估计预期的效果;最后是根据观察更新自身的策略。本文采用领导跟随协议使各个玩家对与其他玩家的状态信息进行更新,采用梯度法对各个玩家的收益函数进行优化。本文主要考虑了以下三个问题:①在多玩家进行非合作博弈过程中,每个玩家通过改变自身的控制输入,进而更新自身的状态,使得收益函数最大化。然而在分布式网络中,不可避免地,存在信道扰动问题。在该问题中,每个玩家与其邻居进行信息交互时,存在高斯白噪声。针对该问题,设计了分布式Nash均衡寻找算法,并证明了各个玩家的状态在均值意义下收敛到Nash均衡点。②在非合作博弈框架下,由于各个玩家属于竞争者的关系,因此各个玩家的状态属于隐私信息,但可以被一些函数所反映,本文假设玩家的状态可以被一些线性随机函数表征。另外,在玩家系统控制过程中,系统也会受到一些过程噪声的扰动。本文考虑了各个玩家的系统受到过程噪声和测量噪声的干扰的情况下,设计了隐私保护下的Nash均衡寻找策略,采用Kalman滤波器估计玩家的状态,一致性协议使得网络中的各个玩家对于该估计值达到共识。最后本文证明了在均方意义下,各个玩家的状态收敛到Nash均衡点。③随着玩家网络规模的逐渐扩大,网络传输资源将受到限制,因此本文采用事件触发机制节省信道资源。在基于隐私保护情况下分布式Nash均衡寻找策略的基础上,为平衡求解质量和通信率,设计了基于事件触发的Nash均衡寻找策略。将单位化后的输出误差函数作为触发函数,人为设定触发门限,当触发函数大于触发门限时,传送观测值到网络端,估计器采用传统的Kalman滤波算法;否则不传输观测值,估计采用先验估计。针对远端估计器采取不同的估计算法,该博弈系统变成切换系统。通过增大触发门限,可以降低通信率,但与此同时也会增大估计误差;当触发门限为0,该机制退化为问题②。最后,本文给出了该算法的稳定性证明。
其他文献
语言在生活中是必不可少的沟通交际工具,也是人类所特有的交际工具,随着人类社会而产生和发展。人们通过使用语言保存和传递人类文明的成果以及个人情感的表达。生活中的语言大部分以文字和语音的形式存在并被使用。其中,语音是语言的物质外壳,是语言的外部形式,是最直接地记录人的思维活动的符号体系。它是通过人的发音器官发出的具有一定社会意义的声音。音高、音强、音长、音色,是构成语音的四要素,同时也是语音的物理基础
科学技术的繁荣发展带给人们诸多便利,三维数据的展现形式层出不穷,逐渐转变着人们的生活模式和思维形式。点云是物体或场景的空间形态和颜色信息的一种特殊表示形式,通常由三维扫描仪或RGB-D相机获取。但是由于摄像机的视角限制,每次三维扫描设备只可记录一定范围内的点云数据,因此需要使用点云配准算法将不同角度的点云进行对齐。三维点云配准作为视觉范畴的经典研究问题,在三维建模、动画设计、文物修复、医学模型处理
微表情是一种面部肌肉运动微弱且状态变换迅速的面部表情,一个标准微表情的面部肌肉运动时长不超过1/3秒。微表情识别任务指的是对已知的微表情片段进行情绪识别,是基于计算机视觉与心理学交叉的主要情感计算工作之一。微表情是人类心理活动的一种外在表现,微表情所表达的情绪可以作为判断人类主观感受的重要依据,因此,微表情识别在刑侦学、测谎、安防等方面具有极高的研究价值。由于微表情变化迅速,所以,如何准确的捕捉面
随着世界经济全球化与科技全球化进程的加速发展,及其对于技术创新重大影响的深刻改革,国际竞争正逐渐向科学技术竞争过渡。高新技术产业作为一个知识密集型与科学技术密集型的产业,对国家经济的发展有着至关重要的作用。高新技术产业在我国发展的日趋成熟,成为我国建设社会主义现代化强国的重要产业。俄罗斯作为世界上的大国之一,在高新技术产业上的发展同样具备自身的优势。产业的发展离不开合作,随着中俄两国的战略协作伙伴
图们江区域是东北亚多民族聚居区和多元文化交融区,是连接俄罗斯、朝鲜、韩国、日本等国家和内地的重要战略区。该区无论是在政治、经济还是在军事上的战略地位,都显得日益重要。因此,图们江区域文化产业的变革与发展不仅对地区内少数民族经济发展、政治稳定有特殊意义,对各民族的多元文化发展也具有同样重要的现实意义。尤其是在“一带一路”倡议提出后,图们江区域如何抓住机遇,积极参与“一带一路”,充分发挥其作用,促进东
随着互联网和云计算技术的发展,网络已经成为人们日常生活、工作和学习不可或缺的基础设施,网络数据随时随地产生,不断累积。个人和机构囤积了大量的数据,这些数据或存储在云上或存储在机构服务器中,已经成为重要的社会资源,如何在安全条件下处理、共享和利用这些数据成为一个新的挑战。点积协议是一种较为常用的数据处理协议,是数据挖掘、统计分析等算法的核心部件,构建高效的安全点积协议,并应用点积协议解决众多场景下的
《老乞大》是朝鲜半岛广为流传的汉语学习教材,最早刊行于14世纪的元代,在之后几百年的时间里,历经明、清、民国时期多次重刊发行。不同时期的《老乞大》,除汉语原版本外,也被多次翻译成韩国语。《老乞大》作为最具代表性的汉语学习教材,较为准确地记录了几百年间的中国北方语言形态和各地的风俗以及韩国语表记习惯,在学术界具有很高的研究价值。目前对《老乞大》的研究成果较为丰富,多数集中在语言学和音韵学领域。《老乞
凭虚玄镇健是韩国短篇小说的奠基人,是具有卓越技巧的作家,也是现实主义代表作家之一。本论文运用现实主义批评方法、社会历史批评方法、比较文学研究方法、接受美学理论、互文性理论等文学方法和文学理论,分析玄镇健短篇小说的人物形象特征、创作手法特点以及与外国文学的关联。本论文包括以下六个部分。具体如下:第一章为绪论部分。主要介绍论文的研究对象和目的,梳理前贤对玄镇健小说的研究成果并指出不足,进而为本选题指明
随着股市的发展,股票市场成为我国经济的重要组成部分,对我国经济的发展起到了很重要的作用,越来越多的人将炒股作为理财的一种方式。随着计算机技术的发展,利用计算机技术对股票信息进行分析更加方便和可靠,因此市面上的股票分析系统越来越多,但是这些系统过于复杂和专业化,可操作性较差,导致许多投资者无法及时获取影响股票波动的全部有效信息,而且部分系统缺少智能分析功能,不能帮助投资者做出有效的投资决策,因此开发
随着科学技术的发展与社会的日益进步,一些高新技术的应用给各行各业带来了不一样的活力,其中无人机技术与人工智能技术是众多高新技术中比较热门的两种。在社会生产生活中,无人机技术被应用于多个行业,例如:农药喷洒、地形勘探、交通疏导、电力设备巡检、病虫害防治、山林防火等,涵盖人们日常生产生活的各个方面。如何将两种技术融合使用,成为了科研人员们的重点研究方向,基于深度学习的目标检测和无人机结合成为了一种常用