基于粒子滤波的强化学习算法研究

来源 :无线互联科技 | 被引量 : 0次 | 上传用户:sunning1002
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文章分析了一种基于粒子滤波和强化学习的算法。该算法通过结合粒子滤波和Q-学习算法,得到一种基于粒子滤波和强化学习的机会频谱接入算法(RLPF)。实验结果表明,RLPF算法能够在策略空间直接进行全局搜索,这是对传统的基于局部搜索策略的强化学习算法的明显改善。
其他文献
航空发动机气膜冷却孔的加工是目前航空工业中亟需解决的主要问题之一,在分析对比了各种航空发动机气膜冷却孔的加工方法优缺点的前提下,利用电解加工的优点,设计研制了一台
为提高挖掘机操纵灵敏性,对挖掘机多路阀先导控制系统进行了仿真研究,考察了先导油管参数对多路阀响应速度的影响。根据管路分布参数模型和液流连续性理论,推导了多路阀先导
文章应用决策树模型分类方法对银行贷款风险进行研究,针对算法往往偏向于取值较多的属性、而取值较多的属性不一定最优的缺点,对ID3进行改进,用平均信息增益代替信息增益作为
目的合成一种新的二聚铜配合物,探讨其体外抗肿瘤作用。方法由苯甲醛、乙醇、醋酸铜在水溶液中反应合成[Cu2(C7H5O2)4(C2H5O2];锥虫蓝细胞计数法观察其对K562细胞增殖的抑制作用。
内皮细胞是衬于脉管系统的一种单层扁平上皮细胞,与机体各个时期的生理性、病理性和肿瘤性血管生成密切相关。1971年Folkman提出了肿瘤的生长依赖于血管生成的假说:在肿瘤形成
近日,由新任马来西亚潮州八邑会馆会长陈联顺拿督率领的潮汕文化访问团一行21人,7月3日至8日访问潮汕地区。 在7月5日至6日陈联顺一行访问汕头。5日晚,汕头市举行仪式欢迎访问
近日,中国银行在全球最大的旅行网站TripAdvisor的中国官方网站到到网“旅行者之选——最喜爱的品牌”评选活动中,荣获“中国旅行者境外消费最受欢迎的信用卡发卡行”称号。
目的建立荧光定量PCR(FQ-PCR)技术定量检测新型隐球菌(CN)的荚膜相关蛋白10(CAP10)基因mRNA,为新型隐球菌的诊断、预后及疗效判断提供依据。方法用逆转录PCR的方法从CN标准株(ATCC348
建构网络教学平台是目前高校教育教学的普遍趋势。建设网络教学平台,既可以培养学生自主学习能力、节省教学资源,同时也能够提高教学质量、推动教学模式的创新,对高校的信息
目的观察外周血管介入治疗大咯血的效果及对患者生活质量的影响。方法选取该院收治的大咯血患者36例,随机分为试验组和对照组各18例,试验组采用外周血管介入治疗,对照组采用