基于改进Q-学习的导航知识获取算法研究

来源 :科学之友 | 被引量 : 0次 | 上传用户:truby
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基本Q-学习算法总是利用当前最优策略进行动作的选取,这样容易陷入局部最优。文章在模拟退火强化学习基础上提出了基于探索区域扩张的Q-学习,加入原地探索策略,提高了找到目标的效率;引入了探索区域扩张策略,避免了初始时在整个环境中加入探索的盲目性,提高了学习效率;加入算法的自主学习结束条件,避免了找到最优路径后的重复学习,节省了学习时间。仿真实验验证了算法的有效性。 The basic Q-learning algorithm always uses the current optimal strategy to select the action, so easy to fall into the local optimum. Based on the simulated annealing reinforcement learning, this paper proposes Q-learning based on exploration area expansion and adds in-situ exploration strategy to improve the efficiency of finding the target. The strategy of exploring area expansion is introduced to avoid the initial exploration of the whole environment Blindness, improve learning efficiency; join the algorithm of autonomous learning end conditions, to avoid repeated learning to find the optimal path, saving on learning time. Simulation results show the effectiveness of the algorithm.
其他文献
目的:分析基层医院常见不合理用药现状,探讨临床改善对策。方法随机抽查我院2010年5月~2012年12月西医处方2500张,分析不合理用药类型及抗生素不合理应用情况。结果2500张西医处
探讨新护士长在科室深入推进优质护理服务过程中,如何克服角色转换过程中的影响因素,找准切入点并把握方向尽快适应护理管理岗位,以确保科室优质护理服务工作的顺利开展实施。
科室是构成医院的基础单位和功能单位,医院水平是全院各科室水平的综合。科主任作为科室的主要领导,对医院的建设与发展,具有重要的地位和作用,因此按时召开科主任例会,对基层医院
目的:研究脑梗死合并颈动脉粥样硬化斑块患者与血浆胱抑素水平的关系。方法选择脑梗死患者164例,所有患者均进行颈动脉超声检查,根据结果将患者分为斑块组56例和无斑块组108例,测
目的:本文主要研究临床上孕妇发生乙型肝炎的宫内感染检验情况,并对其发生率和高危因素进行了探讨。方法选择我院2010年1月~2013年1月分娩的乙型肝炎表面抗原(HBsAg)阳性的孕产妇
总结了对76例糖尿病患者进行糖尿病自我管理的健康教育,即自我管理教育的方法、内容。通过对糖尿病患者进行系统的健康教育,帮助患者改变不良行为、均衡饮食、合理用药、保持良
分析我院病区冷藏药品管理中存在的问题:药品储存温度不确定;冷藏药品摆放不规范,界限不清;同一种药品不同批号,混放于一起;药品种类繁多,分不清是科室备用基数药品,还是次日使用的药
随着医学科研管理事业的发展,医疗质量的不断发展与提高,病案管理已经成为医院管理的一个重要组成部分。病案服务范围日益扩大,对病案管理人员提出了更高的要求。病案人员的专业
目的:观察拉米夫定联合阿德福韦酯治疗慢性乙肝的临床效果。方法选择我院2010年1月~2012年5月住院治疗的慢性乙肝患者90例,随机分为联合组(拉米夫定联合阿德福韦酯)和对照组(单
目的:了解乌鲁木齐市各级医疗机构医院院感管理工作现状,开展针对性管理。方法对64家一级以上医疗机构通过现场查阅资料、座谈了解和考核询问、现场答卷等方法进行调查。结果各