深度强化学习算法分析与对比研究

来源 :网络安全技术与应用 | 被引量 : 0次 | 上传用户:tingchao12
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着经济社会的发展,人工智能技术也得到了快速发展,深度强化学习融入了深度学习的感知能力和强化学习的决策能力,特别是在对运动控制问题的处理上,潜力非凡。本文分析了深度强化学习算法,通过分析探寻深度强化学习在现实生产中应用的可能性。
其他文献
中国正处于从"体力城镇化"走向"智力城镇化"的关键窗口期,能否以生态文明的建构为目标导向,促进社会创新和创造经济价值,是衡量中国城镇化是否能够"华丽转型"走上高质量发展道路的重要标准。根据指标的关键性、客观性、易获性,遴选碳汇指数(CSI)、税收指数(LTI)、专利指数(IPI)共3大关键指标,以各个指标年度之间的变量作为核心依据,对我国城市空间使用的生态效益、经济效益、社会效益进行评价,并构建城
期刊
迁移学习利用不同但相关的源域标记数据来解决目标领域的学习问题,大多数减小域间分布差异的方法依赖于最大均值差异距离,但其仅仅能匹配域间数据分布的各阶矩.此外,隐私保护意识的增强限制了对数据源的访问,对迁移学习的发展提出了新的挑战.本文提出一种基于联合分布核适配的迁移学习及其隐私保护方法,直接在再生核希尔伯特空间中同时减小域间边缘分布和条件分布的差异,从而学习一个域不变核矩阵.此外,我们设置数据源双方
期刊
在传统的特征选择方法中,为了保证行的稀疏性,经常采用l_1范数或者l_(2,1)范数来约束评价矩阵.作为凸正则项,它们在多数情况下可以发挥良好的作用.然而在处理冗余性特征时,一些非凸正则项有望表现出更好的性能.借助自适应流形学习与非凸约束的优点,本文提出了一种新的算法,叫做基于自适应对偶图与非凸约束的嵌入特征选择(adaptive dual graphs and non-convex constr
期刊
全切片数字成像(whole slide imaging, WSI)是病理切片数字化的核心技术,其自动对焦的速度和精度决定了WSI系统的性能.然而,传统的自动对焦方法需要拍摄多张离焦子图像创建图像堆栈,或者需要复杂的硬件调制光学系统,从而限制了WSI在实际场景中的应用.本文设计了基于深度学习的数字病理扫描系统单次曝光自动对焦方法,对子图像逐个进行网络虚拟自动对焦,将单张离焦子图像通过网络直接生成准焦
期刊
联邦学习能够在保障本地数据隐私前提下利用分布式数据和计算资源实现机器学习模型联合训练.现有异步联邦学习有效解决了同步联邦学习所存在的计算资源浪费、训练效率低等问题.然而,现有异步联邦学习通过聚合不同节点训练得到局部模型,并通过中心服务器完成全局模型更新,内生性地受制于中心化信用模式,存在单点失效、隐私泄露等问题.为此,提出了一种基于区块链的隐私保护异步联邦学习,通过上链局部模型并通过共识算法生成全
期刊
随着人工智能技术的突破性进展,人工智能与可视化的交叉研究成为当前的研究热点之一,为人工智能和大数据分析领域的若干核心难题提供了启发式的理论、方法和技术.一方面,人工智能技术的创新应用提升了可视化的分析效率,拓展了分析功能,为大数据可视分析提供了强有力的工具.另一方面,可视化技术增强了以深度学习为代表的人工智能的可解释性和交互性,为可解释人工智能提供了可靠的技术基础.本文从面向人工智能的可视化技术和
期刊
机器学习作为一种强大的工具被广泛应用于可视计算任务,深度学习技术的最新发展更是引起了可视计算领域的广泛关注. SCIENCE CHINA Information Sciences在2021年64卷第11期组织出版了"基于机器学习的可视计算专题"(Special Focus on Visual Computing with Machine Learning),重点推出5篇论文,描述了将深度学习方法应
期刊
随着网络应用的不断发展,以太网作为当前最主要的互联网接入网,其面临的安全威胁越来越严重。本文针对以太网严峻的安全形势,参照IPRRR动态网络安全模型,发挥人工智能在网络安全防护上的技术优势,研究人工智能在动态网络安全模型上的实际应用,构成一个智能立体全方位的以太网安全防范体系。
期刊
随着深度学习技术的发展,其目前已经在网络入侵检测领域展现出独特的优势,本文对深度学习在网络入侵检测中的应用进行了综述,首先介绍一些主流深度学习算法,然后结合前人的一些研究分析每种深度学习算法在网络入侵检测中的利弊,最后对基于深度学习的网络入侵检测技术的一些问题进行讨论,希望给该领域的研究人员提供一些有益的思考。
期刊
传统的以防护为主的网络安全技术已经很难解决当前存在的复杂的网络安全问题,基于深度学习的入侵检测技术能够通过收集计算机网络或者主机上的若干关键点信息并对其进行分析,实时监测网络中是否有违反安全策略的行为或网络遭到袭击的现象。本文主要围绕基于深度学习的入侵检测的关键技术和流程进行阐述,介绍了基于深度学习的入侵检测算法的评价指标,并对基于深度学习的入侵检测方法进行了总结和展望。
期刊