改进Q-Learning算法在路径规划中的应用

来源 :吉林大学学报:信息科学版 | 被引量 : 0次 | 上传用户:t_bear
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对Q-Learning算法在离散状态下存在运行效率低、学习速度慢等问题,提出一种改进的Q-Learning算法。改进后的算法在原有算法基础上增加了一层学习过程,对环境进行了深度学习。在栅格环境下进行仿真实验,并成功地应用在多障碍物环境下移动机器人路径规划,结果证明了算法的可行性。改进Q-Learning算法以更快的速度收敛,学习次数明显减少,效率最大可提高20%。同时,该算法框架对解决同类问题具有较强的通用性。
其他文献
通过近几年实验、示范,总结出在滦平县中上等地力通过选用高产、耐密玉米品种,增加密度,改革种植方式,总结出亩产900公斤的栽培技术模式。
一、加强网络法制建设。加快完善网络监管的法律法规体系二、进一步规范管理,建立网络舆论管理机制网络舆论管理,不单纯是某一部门的责任,现有的管理机制中,公安机关网监部门负责
本刊讯 6月4日.省政协主席杨松赴武汉市东湖新技术开发区.视察省联投集团花山生态新城项目建设情况。
通过对中国与欧美国家跨文化教育对比和分析,提出了改进国内跨文化教育的建议及对策。
同志们:今天,我们在这里召开人民政协理论研究工作座谈会。会议的主要任务是,认真学习贯彻胡锦涛总书记在省部级主要领导干部专题研讨班上的重要讲话精神,深入总结十届全国政协以
政协委员是人民政协履行职能的主体。结合近几年的工作实践,我们深刻地体会到.基层政协要充分发挥委员主体作用,重点要做好“三有”工作:一、善于管理。让委员发挥主体作用有坚实
为解决桥式吊车水平移动过程中的定位控制与防摆控制问题,利用拉格朗日方程建立了其非线性数学模型,设计了自抗扰控制器(ADRC:Auto Disturbances Rejection Controller)并与比例
本刊讯为做好全国政协委员联名提案工作,应随州市政协的邀请,11月22日,全国政协委员、省政协副主席、省科技厅厅长郭跃进率队赴随州.就大遗址保护工作进行调研。
一、建立农产品现代流通体系1、建立农产品现代流通渠道体系。一是建立联盟化、一体化的渠道系统,构建起"大流通、大市场、大集团"特点的农产品流通格局。二是重塑渠道内部架构
旅游业是顾客参与程度较高的服务业之一,而且在随团游和自助游两种形式下顾客参与又存在一定的差异。本文在阐述旅游业顾客参与的维度的基础上,着重分析了在随团游和自助游中