基于聚类算法的强化学习研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:sdg058229
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
强化学习从属于机器学习领域并且是一个重点研究方向,一般用来处理序贯决策问题。其主要应用于众多带有交互性和决策性的问题,这些问题是常用的监督学习和非监督学习方法无法很好处理的。通俗的讲,强化学习就是让智能体连续的同外部环境交互学习,进而完成某个所期望目标的一种模拟人类的学习方法。由于强化学习存在“维数灾难”这一未攻克的难题,分层强化学习领域引入了抽象机制来尽可能的减轻该问题带来的影响。但例如Option、HAM与MAXQ这些经典的方法在智能体开始学习任务之前,均必须人为的去构造它的层次结构,因此在先验知识不足的时候,便会出现所得效果不理想的情况。针对上述问题,提出基于KMeans++和后续表示的Option发现算法。首先对状态空间的后续表示SR进行KMeans++聚类得到子目标集合,其次在不使用外界奖励的情况下,通过潜学习得到Option,其中潜学习不仅从局部上使得每个类的状态逐步靠近该类的聚类中心,而且还从整体上使得每个状态逐渐靠近后续表示SR值最大的状态,然后使用SMDP-Q-learning解决任务,最后利用Grid-1和Grid-2环境验证算法的性能。h-DQN是一种基于内在激励和时空抽象的分层深度强化学习算法,但是h-DQN需要人工设定中间目标的这种方式限制了该模型的使用场景。统一的无模型分层深度强化学习算法利用无监督方法自动求得子目标集合,但在较为复杂环境下得到的候选子目标不是很理想,导致Agent效率低下,效果不是很好。针对这一问题,提出了基于聚类算法的分层深度强化学习。首先利用最近过渡经验集合,将分布异常检测算法和聚类算法结合自动求得子目标候选集G,其次使用改进的kWTA为子目标集合G中的每个子目标建立一个Controller神经网络并对其进行预训练,最后利用Meta-Controller和Controller框架训练整个任务,实验结果表明了此算法在较复杂的环境中也能取得不错的效果。
其他文献
摘要:现代教育技术在中小学课堂教学中得到了广泛应用。本文从创设教学情境激发学习兴趣、增大教学容量提高教学效益、促进个性学习激发学生思维、开展探究学习提高合作能力、提供丰富资源转变学习方式五个方面探讨了应用现代教育技术优化小学数学课堂教学的经验与做法。  关键词:现代教育技术;小学数学;课堂教学  中图分类号:G623.5 文献标志碼:A 文章编号:1674-9324(2014)04-0252-02
面部属性分析是计算机视觉领域研究的热门问题,智能且精准的面部属性分析有着广而深的现实意义。现有的面部属性分析算法,主要分为基于浅层模型的方法和基于深度学习的方法。基于浅层模型的方法的优点在于模型较小,而其缺点在于估计的精确性和鲁棒性较差,对于特征提取的能力有限。近年来随着以大规模数据集训练为基础的深度学习方法的高速发展,在人脸面部属性分析的研究中,深度神经网络因为其面部特征提取的强大能力以及出色的
投融资模式创新是银行业支持国家创新驱动发展战略、推进供给侧结构性改革的重要助力。2016年4月,银监会、科技部和人民银行联合颁布了《关于支持银行业金融机构加大创新力度开展科创企业投贷联动试点的指导意见》(后文简称“《指导意见》”),首次提出支持商业银行设立科技金融专营机构或者成立投资子公司进行投贷联动试点。商业银行以投贷联动为桥梁,解决科技型创新创业公司成长融资需求,是助力科技企业成长、支持经济高
病虫害防治是农业生产过程中的重要一环,可以有效地提高农产品的产量和质量。在蔬菜种植过程中必须要加强对病虫害防治技术的应用,防止病虫害对蔬菜生产产生影响。该文对无公
根据2018年的《科创企业创业展望》,有88%的科创企业认为我国的融资环境十分严峻。科创企业的资本来源大部分是风险投资和私募股权,但其他的融资途径,如银行贷款、并购、政府资助等只占13%。在“大众创业、万众创新”的背景下,政府积极出台扶持科创企业的相关政策。自2016年开始,推动金融业投贷联动试点业务的发展已多次写在了政府工作报告中,国家鼓励银行业试点机构采取“债权+股权”的模式支持科创型中小企业
当今,新一轮科技革命正在全世界范围内兴起,新一代产业不断迭代创新,智慧化、智能化和数字化发展风起云涌,各国纷纷强化创新部署,以期抢占科技创新发展制高点。在知识经济发展和新技术推广应用的潮流下,信息化和智能化日渐深入物流产业的创新发展,智慧物流已成为业界关注的焦点,物流企业紧随时代步伐不断进行积极探索和前瞻性研究,日趋与新技术不断融合发展,因而以科技应用引领物流产业数智化转型发展对物流产业创新发展至
在医学图像中,组织切片图像中密集分布的微血管是判别肿瘤生长和恶性程度的重要特征。针对微血管医学图像分类任务的分类算法对医疗诊断有着重要的辅助作用。同时,皮肤癌作为全球最常见的癌症,通常是通过皮肤表层的色素和纹理来诊断皮肤病变类型。但是,由于皮肤病理类型的种类多,且病理特征较为复杂,往往需要经过专业培训的医学工作者才能完成诊断工作。因此,有效的自动化皮肤病理检测算法可以在很大程度上缓解皮肤病变诊断中
随着科学技术的进步,人们的生活水平和质量逐渐提高,在食材的选择上更加偏爱营养、健康的无公害蔬菜。因此,在生产无公害蔬菜的过程中,必须要保证蔬菜不受到病虫害入侵,有效