在线核选择的对抗式多臂赌博机模型

来源 :天津大学 | 被引量 : 0次 | 上传用户:zjlsxz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在线核选择是在线核方法的重要工作,可分为过滤式、包裹式和嵌入式三种类型。在线核选择中存在“探索—利用”两难问题。既要探索新的核以发现潜在的最优核,同时也要尽可能多地利用当前表现最优的核。但已有的在线核选择方法均忽略了“探索—利用”两难问题。针对这一问题,提出在线核选择的一种对抗式多臂赌博机模型,同时给出在线核选择的包裹式方法和嵌入式方法。提出的包裹式方法和嵌入式方法旨在平衡“探索—利用”。给定候选核集合,候选集中的一个核对应对抗式多臂赌博机模型中的一个臂,在线核选择的每回合依据一个概率分布随机地选择核,并应用指数加权的方法来更新该概率分布。这样,在线核选择问题本质上可归约为一个对抗式多臂赌博机问题。在此基础上研究在线核选择的包裹式方法以及嵌入式方法:1.包裹式在线核选择的对抗式多臂赌博机模型。分别在遗忘对手和非遗忘对手环境下,给出在线核选择的包裹式方法。进一步提出一个新的在线核选择后悔的概念。理论证明在遗忘对手环境下的包裹式方法保证亚线性的期望后悔界,在非遗忘对手环境下的包裹式方法保证亚线性的弱期望后悔界。2.嵌入式在线核选择的对抗式多臂赌博机模型。在非遗忘对手环境下给出在线核选择的嵌入式方法。理论证明嵌入式方法保证亚线性的期望后悔界。最后,标准数据集上的实验结果验证了所提出方法的可行性。
其他文献
创新创业是我国十三五规划纲要的重要主题之一,纲要中阐述了我国关于创新创业的规划,由此可见我国对创新创业的重视。作为企业来讲,企业的创新研发能力一直被视为是企业发展
随着“智能电网”这一概念的提出,实现电网的可靠、安全、经济、高效成为了全球的目标。对广大用户来说,要想实现智能电网,最主要的目标任务是确保电气线路和家用电器的可靠
我国改革开放以来,房产行业迎来了一个蓬勃发展的黄金时代。众多房地产企业想抓住市场机遇迅速做大做强,跨区域发展、多项目经营是必然的路径。但是,目前对于房产项目施工质
随着锂离子电池在电动汽车及各大储能领域的应用越来越广泛,人们对电能的存储及能量密度的要求也逐渐增高。选取何种电极材料对电池性能来说具有不可忽视的意义。虽然氧化物
小麦是世界上最重要的粮食作物之一,种质资源是选育小麦新品种的物质保障,而野生二粒小麦具有丰富的遗传资源,为了实现对它的挖掘和开发利用,本试验用以普通小麦品种Bethlehe
在A型流感病毒中,H3亚型宿主广泛,不仅感染禽类,还感染猪、马、犬等哺乳动物甚至人类,对畜牧业生产和公共卫生安全均构成重要威胁,有必要进行持续的流行病学监测。本研究基于
SF6气体因具有优良的绝缘和灭弧性能,20世纪60年代就被大量应用于电气设备中,但其作为一种强温室效应气体,环保压力较大。为了减少SF6气体使用量以及排放量,国内外学者开展了
水力压裂技术经过几十年的发展,已经成为油气藏,特别是低渗特低渗油气藏最重要的增产改造手段。常规水力压裂技术促进了油气藏的高效开发,但是依然存在高摩阻、高泵压、加砂
近年来,太湖流域农业面源污染居高不下,导致严重的水体污染与河流、湖泊的富营养化。农田沟道作为农田排水通道,是氮磷迁移的主要场所,而农田沟道对氮磷等污染物的拦截也成为控制农业面源污染的关键手段。微生物脱氮作用由于其高效经济的特点受到广泛关注,其中锰氨氧化过程作为新型的微生物脱氮反应,目前鲜有报导。因此,研究农田沟道中的锰氨氧化过程,对控制农业面源污染及河湖水体脱氮具有理论和实际意义。本论文以太湖宛山
建筑结构的发展与社会的发展息息相关,当今人们对优秀建筑的要求不仅停留在建筑功能、安全经济性方面,良好的艺术效果也备受人们追求。由于自由曲面造型丰富且独特美观,可以