基于激励学习算法的移动机器人避障规划研究

被引量 : 0次 | 上传用户:erikwg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着机器人技术的发展,移动机器人以其较高的自主性、智能性和对外界环境的自适应性,在星球探测、军事侦察、医疗服务、深海及核工业等领域都得到了广泛的应用。因此研究具有避障功能的移动机器人及其在未知环境下的避障路径规划具有重要的理论和现实意义。近年来,在诸多机器人避障方法中,激励学习因其不需要监督和先验知识且具有自学习的能力,逐渐应用到未知环境下移动机器人避障规划的研究中。然而在复杂连续环境下Q学习系统面临“维数灾难”问题,需要采取量化的方法来降低输入空间的复杂度,而径向基神经网络(RBFNN)具有较强的函数逼近能力及泛化能力,由此论文提出了基于RBF神经网络的Q学习方法并将其应用于单移动机器人的自主避障,使Q学习系统具有良好的泛化能力。本文从三个方面对Q学习算法进行了改进。1、引入RBF神经网络,采用动态聚类法离线训练样本集,确定隐含层的中心和宽度参数j。2、采用最小均方算法更新隐含层到输出层的权值Wm i。3、采用一个简单的三层RBF神经网络去逼近Q (s,a)值,将所有的输入向量量化到[0,1]之间。验证结果显示,与传统Q学习相比,基于RBF神经网络的Q学习避障方法可以增加自主移动机器人对环境的适应性,提高避碰能力,加速避障学习过程,从而提高移动机器人对未知环境的适应能力。
其他文献
软件技术的开发除了功能的研究,也越来越注重其易用性设计研究,软件用户界面作为软件和用户交互的媒介,图标在其中发挥了重要作用,但目前对于图标的研究都只基于图标的具体制作上
影视动画是文化产业的一个重要组成部分,是一种有着生命力的创造语言,动画电影是集数字技术、文化内涵和创意思维相融合的产物,它以其独特的艺术表现,已成为一种世界共通的视觉艺
近年来,政治关联对企业投资行为的影响引起了研究者的广泛关注,已经成为公司治理领域的一个研究热点。据调查显示企业政治关联普遍存在,尤其是处于经济体制改革和特色社会主义时
<正>爱因斯坦曾经说过:"兴趣是最好的老师".数学是一门重要的基础学科、工具学科,要想让学生喜欢数学,最重要的就是激发他们的兴趣:让枯燥无味的数学变得"有滋有味",使学生由
自有盖髓剂以来人们从未停止过对盖髓剂的探讨,究其原因,是因为一直无理想的盖髓剂。良好的盖髓剂的基本性能有:(1)对牙髓组织无毒性和刺激作用,有亲和性;(2)有杀菌或抑菌作用;(3)
随着电信网络规模的迅速扩展,多厂商、多制式和分布式管理问题日益突出,现有的集中网管系统难以实现从全局的角度对传输网络进行管理。因此,电信运营商们都热切盼望能有一个高覆
本文以现今中国琵琶艺术"传统流派"的日渐式微这一现象为切入点,通过对琵琶艺术发展过程中存在的问题进行剖析、检视,提出相关对策性研究思路,并试图寻找未来琵琶艺术健康发展
中国近代史主线问题,长期聚讼不已。1980年代以来,以范文澜、胡绳为代表的传统派的观点,受到了来自黎澍、李时岳等人的挑战。黎澍、李时岳学派的观点"近代化是中国近代史的主
目的探讨乙型肝炎患者血清IL-2、sIL-2R含量与肝损程度和HBV DNA含量的相关性及临床意义。方法收集急、慢、重型乙肝患者血清标本共93例,28例健康人血清标本作为对照组,采用E
随着绿色经济时代的到来,服装业的发展也开始变得多样化,为适应全球经济发展和环境保护的发展趋势,出现了服装生态化设计。人们对服装的要求开始从追求美观发展到强调其舒适