【摘 要】
:
强化学习算法广泛的应用于路径规划,使移动机器人能够与环境交互并实现自主避障、获取最优路径。传统Q(λ)-learning算法所采用的探索策略存在探索利用平衡问题,由于收敛过早
【机 构】
:
沈阳新松机器人自动化股份有限公司特种机器人BG,沈阳科技学院机械与交通工程系
论文部分内容阅读
强化学习算法广泛的应用于路径规划,使移动机器人能够与环境交互并实现自主避障、获取最优路径。传统Q(λ)-learning算法所采用的探索策略存在探索利用平衡问题,由于收敛过早,往往得不到最优解。本文提出一种动态调整探索因子的探索方法,以探索成功率判断机器人对环境的熟悉程度,指导探索过程,从而找到最优路径;采用栅格法建立地图。通过仿真和对比试验证明了该方法可以得到全局最优策略。
其他文献
根据矿区的环境现状,提出了一种煤矿开采的创新理念——绿色开采。该文针对目前煤炭开采过程中的固体废弃物、污水、有毒有害气体、矿区地表下沉等诸多污染问题,论述了绿色开采
目的:观察蝎毒抗癌多肽(APBMV)与放疗(RT)合用对H22带瘤小鼠脂质过氧化的影响 .方法: 取H22带瘤小鼠100只, 观察不同剂量APBMV与放疗合用后肿瘤生长抑制率(IR)、血清SOD活力
发生在天祐二年白马驿事件,是一起酷杀唐朝臣的历史事件。本文考察了这起事件的过程,分析了谋主、被害者的情况,指出白马之祸之所以发生乃是一种怨恨心理的结果。白马之祸,标
“创新是一个民族进步的灵魂,是一个国家兴旺发达的不竭动力。”创新就是要解放思想,事实求是,与时俱进。那么作为教书育人的我们,在课堂教学中如何培养学生创新核心素养呢?我认为
硫唑嘌呤(Azathioprine,Aza)作为常规免疫抑制剂,广泛应用于器官移植,它和环孢素A(CsA)、强的松(Pred)联合(合称为三联)应用,可以增强免疫抑制效果,减少副作用,提高移植器官存活率,
本刊讯 经过连续几年的努力,贵州省计划建设的98个城镇污水处理厂。目前已建成78个,剩余20个也将在今年6月以前全部建成投运。
大学生是构建和谐社会的中坚力量,因此高校应重视大学生和谐责任意识的培养。本文从和谐责任意识培养的着力点和培养途径两方面进行了论述,旨在为构建社会主义和谐社会提供强
党建思想工作是党的政治优势和优良传统,也是企业全部工作的生命线。思想政治工作的科学性与实效性虽然具有不同的属性,却又互相联系相辅相承密不可分。科学性是指思想政治工
探寻SOLO分类评价法理论的由来,得出SOLO分类评价法理论不仅对学生回答问题的数量,还对学生回答问题的质量(即学生思考问题、组织答案的过程)进行了评价,更科学和全面。
油区综合治理工作是一项长期、复杂而艰巨的工作。油区治安状况的好坏已成为制约油田发展的一个重要因素。近年来,油田把综合治理工作作为可持续发展的一项重要保证措施来认识