基于协同最小二乘支持向量机的Q学习

来源 :自动化学报 | 被引量 : 0次 | 上传用户:xbzss123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对强化学习系统收敛速度慢的问题,提出一种适用于连续状态、离散动作空间的基于协同最小二乘支持向量机的Q学习.该Q学习系统由一个最小二乘支持向量回归机(Least squares support vector regression machine,LS—SVRM)和一个最小二乘支持向量分类机(Least squares support vector classification machine,LS—SVCM)构成.LS—SVRM用于逼近状态-动作对到值函数的映射,LS-SVCM则用于逼近连续状态空间到离散
其他文献
土地估价对于评估土地的经济效益和发展前景具有重要的参考作用,能帮助土地估价人员公正、客观地估价,论文将研究基本的土地估价方法,为相关研究提供参考。
村级财务监管问题关系到村民自身利益,也关系到美丽乡村建设步伐。当前,我国村级财务监管存在债务不清、产权不明、使用不当等问题。本文对葛岭镇村级财务监管问题进行调研,
德国科学家日前研究发现,β干扰素可有效抑制SARS病毒增殖。科学家在26日出版的《柳叶刀》杂志上发表论文介绍说,将β干扰素和其他药物结合使用可能取得治疗SARS的更佳疗效。
物流,多么美好的字眼。说它美好,是因为它被业界称为"第三利润源"、被媒体称为"21世纪最大的行业"、被老百姓称为"金饭碗"。就象当年IT热席卷中国,中关村卖鼠标的也自称从事I
中部地区已经取得了翻天覆地的变化,但仍然面临着区域经济一体化挑战、内陆经济开放性不足、现代农业基地产业升级压力、生态文明建设与传统发展理念相冲突等挑战。中部各省应
报纸
20世纪90年代以来,我国金融市场中的直接融资有了较快的发展,但是作为直接融资重要组成部分的企业债券融资数额却明显偏小.我国企业债券市场的发展滞后有着多方面的原因,本文
基于协同竞合思维,宏观层面地分析三大都市圈区域内各省市体育产业协同发展的背景与意义、条件与机遇,以及协同竞合开发的制度保障、现期主要途径、长期保障、需要基础、供给基
教育是一个国家最根本的事业。振兴教育取决于培养高素质的教师。随着基础教育改革的深入,教师专业的专业化程度越来越高。在这样一个新的形势下,如何把握和适应国内外教师教
现行房地产税主要承载了经济调节和收入分配功能。未来纳入地方税系作为重要税源的房地产税应主要基于受益原则和资源配置功能。本文认为,受益原则和资源配置功能不仅决定了
溃疡性结肠炎(Ulcerative colitis,UC)是发生在盲肠及结直肠的慢性炎症性疾病,可导致多种严重的肠道外炎症表现和并发症,甚至诱发结直肠癌,已成为全球性的公共健康威胁。目前