【摘 要】
:
在互联网中,企业或组织会通过收费或限制免费的方式在网站中开放自己的技术和应用供网上的潜在客户使用,但出于成本考虑和稳定性以及个性化产品迭代等需求,需要创造属于自己的服务,于是模型逼近和模拟的需求便应运而生,模型逼近和模拟即使用智能算法来逼近网络中的黑盒模型,最终复现该模型的功能。深度强化学习近年来是研究的热点,大量学者将其运用在游戏、视频等机器视觉领域中,并在各人类的策略竞技中取得了不菲的成绩,可
论文部分内容阅读
在互联网中,企业或组织会通过收费或限制免费的方式在网站中开放自己的技术和应用供网上的潜在客户使用,但出于成本考虑和稳定性以及个性化产品迭代等需求,需要创造属于自己的服务,于是模型逼近和模拟的需求便应运而生,模型逼近和模拟即使用智能算法来逼近网络中的黑盒模型,最终复现该模型的功能。深度强化学习近年来是研究的热点,大量学者将其运用在游戏、视频等机器视觉领域中,并在各人类的策略竞技中取得了不菲的成绩,可见深度强化学习在机器视觉领域有良好的表现。论文以百度AI平台开放的图片分类器为例,提出了基于莫兰指数的代理互联网协议地址(IP)调用策略,加速了基于深度Q网络(DQN)的智能体交互学习过程,最终完成了该分类器的逼近和模拟。首先,整理从互联网各免费代理发布网站中搜集到的代理IP作为IP池,使用更通用的国外IP作为代理,以代理爬虫的方式访问AI平台开放的接口,解决了国内代理在部分网站内容的访问受限问题和AI平台对IP限速访问的问题。其次,提出了一种基于莫兰指数的就近调用策略,该方法对代理IP的地理位置和延迟进行空间统计,中国的局部莫兰指数和检验数为0.98和2.21,证明代理IP的响应速度在中国周边地区存在正的空间自相关性。经过30次交互实验,就近策略耗比随机策略少57秒,且该方法不需要服务器的不断测试,解决了传统IP调用策略中的延迟过高问题和服务器负荷过高问题,同时也加速了智能体交互的速度,缓解了智能体训练周期过长问题。最后,使用基于代理IP的DQN智能体与AI平台交互,对比传统的深度学习,DQN的强化学习机制有更加通用稳定、更接近人类思维方式,不需要人工标注的离线训练数据等优点。经过13288次交互,在测试集上达到了 85.5%的相似度效果,得到了 AI平台分类器的模拟模型,证明了论文中模型逼近和模拟方法的有效性。
其他文献
随着半导体技术的发展,芯片越来越受到重视,尤其是在国内芯片发展还不够成熟的情况下。如今已经进入网络社会时代,网络在生活中扮演着一个特别重要的角色,人们的生活几乎离不开网络。而以太网从70年代产生到现在,经过了40多年的发展,速率已经从最开始的10M逐渐发展到万兆,技术上也在不断成熟,并形成了统一的标准,无疑是网络中重要成分之一。本文基于12nm的CMOS工艺,设计了一种以太网接口发送和接收数据一体
随着第五代移动通信(5th Generation Mobile Communication,5G)的发展,大规模MIMO系统(Massive Multiple-Input and Multiple-Output,M-MIMO)作为5G关键技术之一,通过增加空间的自由度,极大地提高了无线通信系统容量,因而,成为目前的研究热点。但是,在大规模MIMO系统中,由于用户数和天线数不断地增加,用户间的相关性
进入后续改革时期,人民的生活在不断改善的同时,发展成果非广泛性的共享问题突显,阶层性的收入分配差距拉大,社会福利分配不平等程度逐渐扩大,发展不均衡现象严重。共享理念能够有效缩短贫富差距,缓解区域、城乡经济发展不均衡的局势,减少分配不公现象的发生,促进人和自然界和谐共处,进而形成稳定的社会环境。本文的主要研究工作如下:(1)共享发展成果的理论基础。以习近平总书记在十八届五中全会中所指出的“共享是中国
环烷烃是一类重要的石油化工产品,通过催化氧化可以将其转化为多种化工产品,如环烷醇、环烷酮、环烷基过氧化氢和脂肪族二酸,应用均十分广泛。其中,环烷醇和环烷酮是制备聚酰
吕斯百先生早年受教于徐悲鸿先生,他被认为是近代以来最重要的徐老艺术的继承者。解放前后,吕斯百曾经先后在南京和兰州的三所大学任教,并担任系主任职务,对我国的高等美术教育教学工作产生了巨大的影响。论文通过对吕斯百生平经历的回顾研究,以总结吕斯百美术教育思想为基础,系统性的归纳了吕斯百先生的美术教育思想。首先,通过资料收集,详细的重新回顾了吕斯百的人生经历,将之划分为早年经历、留学生涯和执教生涯三大部分
信息隐藏是一种秘密通信技术,它是将秘密信息隐藏到看上去普通的载体信息中进行传送,以避免窃听者的怀疑。因为载体本身具有一定的冗余性,所以传统的信息隐藏算法都是通过修改载体来嵌入秘密信息。虽然这些方法都实现了秘密信息的隐藏,但是在修改载体的过程中会将修改痕迹留在含密载体上,因此隐藏算法不能彻底的抵抗各种隐写分析算法的检测。为了能彻底地抵抗各种隐写分析技术的检测,提出了“无载体信息隐藏”这样一个新的概念
由于能源危机和环境问题,电解水作为一种清洁高效的制氢技术而受到越来越多的关注。电解水的整体效率取决于阳极的析氧反应(OER)。目前,具有良好的OER催化性能的贵金属Ru和Ir
深度学习是人工智能领域的一个重要的研究方向。深度学习源于生物神经网络学,通过组合低层特征形成更加抽象的高层特征,以发现数据的分布式特征表示。深度学习领域常用的栈自
随着移动通讯技术的发展,2G、3G通信已无法满足人们对于影音娱乐、数据通讯方面的需求,LTE作为第4代移动通讯标准(4G)网络,一经出现便获得了快速的普及。目前有很多国内厂家都在对4G模块的开发及应用进行大量的投入。应国内运营商要求,4G模块需要向下兼容3G与2G网络。此外,由于4G模块通常被集成在车载、手持、穿戴、电力、安防等领域的设备上,有时还需要支持GNSS系统。4G模块的硬件设计涉及到电路
审计质量是衡量财务会计信息质量的重要指标,审计师在审计过程中往往会受到管理层的影响。一方面管理层可能会对审计师的独立性产生干扰;另一方面管理层的盈余管理行为也会影