基于不完全信息随机博弈与Q-learning的防御决策方法

来源 :通信学报 | 被引量 : 8次 | 上传用户：yudsly2001

【摘要】

：

针对现有随机博弈大多以完全信息假设为前提,且与网络攻防实际不符的问题,将防御者对攻击者收益的不确定性转化为对攻击者类型的不确定性,构建不完全信息随机博弈模型。针对网络状态转移概率难以确定,导致无法确定求解均衡所需参数的问题,将Q-learning引入随机博弈中,使防御者在攻防对抗中通过学习得到的相关参数求解贝叶斯纳什均衡。在此基础上,设计了能够在线学习的防御决策算法。仿真实验验证了所提方法的有效性

【作者】

：

张红旗杨峻楠张传富

【机构】

：

信息工程大学三院,河南省信息安全重点实验室

【出处】

：

通信学报

【发表日期】

：

2018年08期

【关键词】

：

网络攻防随机博弈 Q-LEARNING 贝叶斯纳什均衡防御决策 network attack and defense stochastic game Q-l

【基金项目】

：

国家高技术研究发展计划(“863”计划)基金资助项目(No.2014AA7116082,No.2015AA7116040)

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

串联式混炼

<正> 前言目前生产混炼胶料所采用的加工工艺如下所述: 1.两段或者多段式工艺。两段或者多段式工艺是目前最通用的混炼方法。然而,它们在多重加工方法和母炼胶的贮存空间及存

期刊

橡胶混炼串联式

水平连铸铜坯加工余量的探讨

<正> 1984年我厂采用水平连铸工艺加工铜锁体坯,材质为ZH Pb59—3,加工工艺为:水平连铸→加工工艺头(压柄)→拉削,参见图1。主要技术要求是:1.表面无裂纹、气孔等缺陷,2.坯条

期刊

水平连铸铜坯加工余量

生和死，这是一个问题

中国出版社过去的几年和即将到来的几年，是一个由渐变到突变的重大转型期，这个转型期是每一个出版社生与死的考验关口，套用哈姆雷特的一句话：“生和死，这是一个问题。”这没有什么

期刊

中国出版业体制改革市场经济价值观念管理理念

美国杂志出版商开拓中国大陆市场策略（下）

一方面，中国的杂志业需要注入新鲜的血液。以推动其自身的发展。以更强的姿态融入到国际杂志市场中去；另一方面，在吸收国外先进文化的同时，也需要保护本国的文化产业。怎样才能在

期刊

中国大陆杂志业市场策略出版商美国杂志市场先进文化文化产业主管部门平衡点

自动化立体仓库实训系统研究

随着物流业的发展，自动化立体仓库的推广使用势在必行。为教师和学生提供一个与生产实际相一致的实践教学蒂件，本文提出了自动化立体仓库实训系统的总体结构厦各部分的设计情况

期刊

自动化立体仓库实训系统设计

小学数学应用题-变化题教学之我见

应用题是小学数学教学的重要内容。小学应用题教学，以要求学生掌握知识为重点。在应用题教学中重要的是知识的获取。如何让学生掌握应用题的解题方法，是应用题教学中的重中之重

期刊

数学应用题数学教学小学基础理论知识逻辑思维能力应用题教学解题方法学生

用EXCEL软件进行测量系统分析(ANOVA法)

对于大批量生产的制造过程,进行测量系统分析是确保生产过程稳定的重要条件,方差分析法是研究测量系统的一种先进方法,其最大的特色是分析结果可以体现评价人和测量零件之间

期刊

测量系统分析EXCEL软件ANOVA法

基于迭代剔除的SCMA多用户检测算法

针对稀疏码多址接入(SCMA)系统中译码算法复杂度高问题,提出一种基于迭代剔除的多用户检测算法(RM-MPA)。首先基于串行消息传播机制提出了一种简单直观的方法用于比较用户间的译码优势,然后在每轮迭代过后,对译码优势高的前n个用户直接进行译码并剔除,不再参与后继迭代过程,从而使后续每轮迭代的复杂度依次降低。在此基础上提出了译码优势用户排序和正交用户分组2种剔除策略。实验结果表明,基于正交用户分组剔

期刊

稀疏码多址接入消息传播算法多用户检测迭代剔除策略sparse code multiple accessmessage passing algorith

计算机辅助制版系统在服装结构设计中应用

计算机辅助制版系统CAD／CAM，可以使服装专业结构设计制图精确化，并能显著的提高打板速度。该系统用于服装结构设计是建立在服装打板与计算机技术的基础上进行整体构思，通过计算机

期刊

计算机辅助制版系统服装结构设计应用

电缆用乙丙橡胶／氯磺化聚乙烯橡胶共混绝缘胶料

<正> 1 前言橡胶电缆是由提供导电通路的金属导体和可交联的橡胶基包覆层绝缘体组成。该绝缘体的组成主要是与其电性能有关,它可避免带有电压的导体和其它物体直接接触。绝

期刊

电缆乙丙橡胶聚乙烯橡胶胶料

基于不完全信息随机博弈与Q-learning的防御决策方法

与本文相关的学术论文