基于深度学习的不完全信息博弈决策的研究与应用

来源 :南昌大学 | 被引量 : 0次 | 上传用户:hummerandy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人类日常生活中无时无刻不在做着权衡与决定,这些解决问题的场景可以被抽象成博弈决策问题。博弈根据信息的掌握程度可以划分为完全信息博弈和不完全信息博弈两类。不完全信息博弈问题通常是指参与者无法完全掌握博弈过程中的所有信息而进行博弈的过程。在现实生活中譬如商业谈判、信息安全、广告定价、军事推演、游戏娱乐等诸多问题都能够归纳为不完全信息博弈问题。随着人工智能研究的不断深入以及深度学习应用的不断推广,利用深度学习解决不完全信息博弈决策问题已经成为机器博弈领域的研究热点并且具有十分重要的现实意义。目前,解决不完全信息博弈智能决策问题的传统方法是借助增强学习对于博弈问题建模,通过设计奖励函数以及构建博弈树转化博弈问题,再借助博弈树搜索和价值迭代来最终确定和优化关于博弈策略的状态-动作值函数。传统方法在完全信息博弈或者简单的不完全信息博弈场景表现尚可,但是面对复杂背景下的不完全信息博弈,存在值函数无法收敛、博弈树过大以及模型训练十分耗费资源等问题。针对这些问题,本论文提出利用深度学习来求解复杂背景下的不完全信息博弈决策问题的方法,主要完成的研究工作包括以下几个部分:1.设计了基于知识规则的语义分割方法。对博弈智能决策问题进行建模,将不完全信息博弈的可观测信息以及与博弈决策相关的重要信息提取出来并压缩成一个三维的多通道图像。语义分割方法以博弈规则为基本元素,完整的描述了当前博弈局面下的重要信息,并且基于简单的博弈知识将可能影响决策的关键因素构建成低层次的图像组成部分,克服了传统方法需要构建博弈树的复杂计算,为深度神经网络的训练提供格式友好的数据。2.设计了基于改进的深度残差网络训练不完全信息博弈智能决策模型的方法。考虑到深度学习模型随着神经网络层数不断加深可能出现的梯度消失等问题,本论文在原有的深度残差模型拓扑结构之上,利用多尺度非对称卷积层设计对于图像信息多层次特征提取的优势,再结合多并行分支网络结构增加网络宽度提升网络学习能力的特点,提出Inception+子结构以及多个子结构和残差网络的恒等映射连接而成的新的残差块GoBlock。实验结果表明,基于相同的博弈场景图像数据集,改进的深度残差网络在不完全信息博弈决策的分类预测问题中以77.4%的分类精确度超过其他经典的机器学习和深度学习方法。3.设计了基于深度学习的不完全信息博弈智能决策系统。在一种复杂背景下的多人不完全信息博弈问题(竞技麻将)上,通过真实对战数据训练深度神经网络模型实现了智能决策系统。并且,该系统与其他机器学习算法生成的决策模型进行了博弈对战。与此同时,通过将该系统部署在某款线上竞技麻将应用中与真实的人类选手进行对弈。实验结果表明:本论文提出的智能决策系统在平均得分和平均胜率上相比其他决策系统水平更高。在与一般的人类选手进行5900局对战中,智能决策系统以平均胜率26.471%超过人类选手。通过分析对战回放进一步证明智能决策系统已经具备高水平的博弈决策能力。
其他文献
“话语权”就是说话权,即控制舆论的权力。话语权掌握在谁手里,决定了社会舆论的走向。当前,青年学生成为上网族中的主力大军,他们是祖国的未来,如何做好他们的舆情引导显得尤为重
多花黑麦草(Lolium multiflorum Lam.)是一种冷季型优良牧草,具有生长迅速、适口性好、消化率高等特点,具有较高的经济价值。利用染色体加倍的方法对多花黑麦草种植资源进行
本课题以永磁同步电机为执行电机,采用三闭环位置伺服控制方案,直轴电枢电流为0的矢量控制策略,制作了以DSP为处理器的运动控制器;采用ACPM750E为电机功率驱动模块,进行相应
目的观察脾多肽注射液对HBe Ag阳性慢性乙型肝炎患者免疫功能的影响。方法选取94例HBeAg阳性慢性乙型肝炎患者,随机分为治疗组与对照组,各47例。对照组给予恩替卡韦分散片口
《驶向中国的慢船》是村上春树于1980年4月发表的第一部短篇小说集,现存的中文翻译版本为1995年由香港博益出版社出版的《開往中國的slow boat》、2001年由台湾时报出版社出
本文旨在考察将社会研究用于规划和制订社会政策的各种有关问题。它回顾了一系列的研究应用模式,考察了研究者们从事与政策相关之研究的动机,以及他们所面临的体制性障碍。它把
<正> 第二次世界大战以后许多新兴独立国家未能建立民主政治制度,这就促使一些学者致力于探讨建立民主制度的必要条件。从50年代末到60年代初进行的早期研究强调了政治制度与
<正>新华网淮安2016年8月10日电(刘映)深化医改重在"保基本、强基层、建机制",在推进分级诊疗,改善老百姓看病难、看病贵的过程中,如何坚持以人为本、重心下沉、关口前移,全
近十年来,移动支付的快速发展使全球金融服务的普惠性和可得性大幅提高。同时,支付成为一个入口和平台,逐渐向理财、贷款、教育、医疗、出行、娱乐等多种服务业态延伸,全方位
线性算子谱理论是这些年来被广泛研究课题之一,因为线性算子谱理论可以解决数学、物理及其应用领域中所涉及的许多问题,例如,弯曲方程、振动方程等等.首先,非自伴算子在实际