【摘 要】
:
深度强化学习是结合强化学习和深度学习的技术,近年来在人工智能方向获得快速发展突破,且在社会的各个领域都有所应用,例如金融交易、自动驾驶、网络安全。随着深度强化学习的应用越来越广泛,越来越多的研究人员开始对深度强化学习技术的安全性进行研究。目前已经有研究表明深度强化学习技术容易受到对抗样本的攻击和容易受到模型窃取的攻击。攻击者可以利用模型窃取技术窃取目标模型,给模型所有者造成商业价值损失,因此保护深
论文部分内容阅读
深度强化学习是结合强化学习和深度学习的技术,近年来在人工智能方向获得快速发展突破,且在社会的各个领域都有所应用,例如金融交易、自动驾驶、网络安全。随着深度强化学习的应用越来越广泛,越来越多的研究人员开始对深度强化学习技术的安全性进行研究。目前已经有研究表明深度强化学习技术容易受到对抗样本的攻击和容易受到模型窃取的攻击。攻击者可以利用模型窃取技术窃取目标模型,给模型所有者造成商业价值损失,因此保护深度强化学习中的模型至关重要。本文从攻击者的角度出发,研究深度强化学习中的模型窃取问题,对构建安全可靠的深度强化学习模型具有重大的研究意义。现有的针对深度强化学习的模型窃取技术具有训练代价大和窃取风险大的问题。为了解决以上问题,本文以Deep Q Network(DQN)作为目标模型,以窃取目标模型作为目的,提出两种深度强化学习模型的窃取技术,包括:基于Q值访问的模型窃取技术和基于Q值预估的模型窃取技术。(1)基于Q值访问的模型窃取技术。该方法目的是窃取目标模型DQN。方法的实现流程是首先窃取到目标模型的训练数据,其次使用窃取到的训练数据训练本地替代模型,最后评估本地替代模型的性能是否接近目标模型。考虑到目前已有的模型窃取技术存在的训练代价大以及窃取风险大等问题,在该方法中目标模型训练数据的窃取阶段进行了数据筛选处理,使用Q值访问的方法完成关键数据筛选。因此该方法使用少量关键数据即可完成目标模型的窃取,这种方法降低了模型窃取的代价。(2)基于Q值预估的模型窃取技术。该方法是对第一种方法的改进,针对第一种方法中存在的存储代价大、数据筛选效率低、隐蔽性低的问题进行了优化。该方法实现流程是首先训练数据挑选模型,其次使用数据挑选模型挑选关键数据,然后使用关键数据训练本地替代模型,最后评估本地替代模型性能。与Q值访问的模型窃取技术相比,Q值预估的模型窃取方法使用数据挑选模型挑选关键数据,不仅避免了数据挑选过程中不重要数据的存储,还避免了频繁访问目标模型的Q网络。因此该方法提高了模型窃取技术的窃取效率以及窃取隐蔽性。
其他文献
随着现代社会的快速发展,人们的生活压力越来越大,我国慢性胃炎的发病率越来越高,合并焦虑抑郁状态的慢性胃炎患者也在逐年增加。西医治疗以抑酸护胃、促进胃肠动力、抗焦虑抑郁以及对症支持治疗为主,临床疗效欠佳且有一定的不良反应,中医在慢性胃炎伴焦虑抑郁状态治疗方面具有独特优势,前景广阔。本文查阅了近10年来的相关文献,从慢性胃炎伴焦虑抑郁状态的病因病机、中医辨证分型、中医治疗方面进行概述,以期为临床辨证用
洪涝灾害发生过程中观测数据多源异构(遥感影像、社交媒体文本、地理信息数据等),难以利用互补优势融合应用于风险评估和提供决策知识。本文研究基于多模态数据的洪涝灾害知识图谱构建方法,融合抽取遥感影像与社交媒体文本知识,形成多模态洪涝灾害知识图谱。基于自顶向下的方法细分领域概念,构建洪涝灾害领域本体层。通过深度残差全卷积神经网络对遥感影像进行智能解译,利用地理逆编码将影像解译信息转化为文本,实现影像信息
背景:衰弱是各层次的风险因素共同作用的结果,包括生理、心理和社会因素。现如今越来越多的学者开始关注衰弱的心理社会因素。焦虑发病隐匿,常常不被重视,国内外已有研究发现衰弱与焦虑之间存在正相关。动态动脉硬化指数(AASI)可作为评价动脉僵硬程度及预测心血管事件的指标,已有研究发现AASI与衰弱程度相关,而焦虑通过神经体液、社会、心理等多方面可影响衰弱患者动脉结构和功能。但目前针对AASI与焦虑程度的研
目的:探讨基于老年综合评估的围术期综合护理干预在髋部骨折合并衰弱患者中的应用效果,以期促进患者术后功能恢复和提高健康结局。方法:选取2021年10月至2022年7月新疆某三级甲等医院关节外科收治的符合纳排标准的71例髋部骨折合并衰弱患者为研究对象,按照随机数字表法分为干预组36例和对照组35例,分别实施基于老年综合评估的围术期综合护理干预和骨科常规围术期护理。比较两组患者术后衰弱、认知功能、POC
滇池流域是长江水源的重要涵养地和我国西南的生态安全屏障,其生态系统完整性变化是整个流域生态系统质量和稳定性的重要体现,对生态系统保护和修复具有重要指导意义。通过ArcGIS空间分析、地理探测器模型和皮尔逊相关分析等方法,基于生态系统结构、功能和弹性三方面构建综合指数,评估2000—2020年滇池流域生态系统完整性时空变化,分析生态系统完整性演变的驱动因子及其作用机理。结果表明:(1)滇池流域生态系
通过对消防稳压系统稳压泵的设计压力在各种情况下压力的选择分析后提出,国家标准《消防给水及消火栓系统技术规范》(GB 50974-2014)关于消防系统稳压泵的设计压力规定第5.3.3条,虽然是消防系统的合理、充分的规定,但是由于消防系统不同,稳压泵的设计压力仅仅按照该条规定选择,是存在一些问题的。
<正>1研究临时高压消防给水系统稳压泵设计流量和开关流量设定值的动因1.1相关背景介绍随着近几年我国城镇化建设的不断发展,使得建筑逐渐朝着超高层、大体量、差异化的方向演变,虽然有效解决了人们的居住以及工作问题,但也存在着诸多的安全隐患。如一旦发生火灾等安全事故时,电梯等运载设备将无法使用,那么对于高层的住户而言,就会产生极大的安全隐患,
从衰弱对结直肠癌病人不良结局的影响、结直肠癌病人的衰弱评估及衰弱管理现状进行综述,提出医护人员应尽早识别结直肠癌病人的衰弱状态,结合衰弱病人最优需求,从医患双方衰弱视角下探索适合我国结直肠癌病人的最佳衰弱管理策略。
多囊卵巢综合征(polycystic ovary syndrome, PCOS)是临床常见的一种生殖内分泌激素异常和代谢紊乱的疾病,临床症状表现多样,病因病机复杂。近年来的研究表明,遗传学、生殖内分泌激素、炎症因子、肠道菌群、微小RNA、信号转导通路和胰岛素抵抗等与PCOS的发生发展密切相关。关于PCOS的治疗方式,西医多针对雄激素升高、排卵异常、月经不调、胰岛素抵抗等进行对症治疗;中医注重调理,
作为保障城市运行的重要手段,安全生产执法检查在减少和防止生产安全事故上发挥着关键作用。然而,隐患实体数量大、种类多,与有限的执法力量相矛盾,给相关执法机构造成信息过载,导致检查重复或漏检。为了解决这一矛盾,本文通过安全生产执法数据构建安全生产执法要素知识图谱,利用知识图谱中丰富的语义关系,辅助推荐模型提高推荐性能,为执法部门推荐不同企业中需要重点检查的场所场地、设备设施,助力精准化执法,提高执法效