基于强化学习的多机器人避碰算法研究

来源 :信息技术 | 被引量 : 0次 | 上传用户：dajiange

【摘要】

：

采用强化学习解决多机器人避碰问题。然后针对表格式Q学习算法只能用于离散的状态并且学习时间过长,难以收敛的不足,提出了神经网络和Q学习相结合的算法。最后将该算法应用到

【作者】

：

段勇陈腾峰

【机构】

：

沈阳工业大学信息科学与工程学院

【出处】

：

信息技术

【发表日期】

：

2012年6期

【关键词】

：

多机器人避碰强化学习神经网络 multi-robot collision avoidance reinforcement learning neural n

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

采用强化学习解决多机器人避碰问题。然后针对表格式Q学习算法只能用于离散的状态并且学习时间过长,难以收敛的不足,提出了神经网络和Q学习相结合的算法。最后将该算法应用到多机器人避碰问题中,仿真实验表明该算法有效,能较好地解决多机器人避碰问题。

其他文献

基于无线传感网的工厂环境监控系统设计

为了方便地管理无线传感网络,文中以工厂生产环境监控为例提出了一种新的层次型的无线传感网络控制系统,该系统具有很好的系统移植特性及扩展特性,经测试证明,该系统具有较好

期刊

传感网OPENSSL层次型系统WSN OpenSSL hierarchical network

小学数学教学中应渗透德育教育——教育案例分析

德育教学在学校教育工作中占首要地位，这是无可非议的，但在大多数老师中则认为德育教育只是在思想品德课、语文课的教学中才能进行，寓德于教。或在班队课中对学生进行德育教育，这

期刊

小学数学教学德育教育渗透德育杨辉三角案例分析

ZG银行泰安分行中小企业信贷风险控制研究

回回产卜爹仇贱回——回日E回。”。回祖一回“。回干肉果幻中 N_。NH lP7-ewwe--一”＄ MN。W;- __._——————》砧叫]们羽制作:陈恬’＃陈川个美食 Back to yield

学位

中小企业信贷风险风险控制

油气处理厂生产管理综合自动化系统设计模式研究

针对大庆油气处理厂管理自动化水平不高,影响经济效益的问题,提出将LonWorks 现场总线控制系统与信息管理系统相结合,形成油气处理厂生产管理综合自动化系统设计模式,并详细

期刊

油气处理LONWORKS现场总线综合自动化gas and oil-processed LonWorks fieldbus compositive auto

VV＆A and confidence assessment of a complex giant system simulation model

It is difficult or even impossible for a pure mathematical model to represent a complex giant system because of the complexity, activity, uncertainty in such a

期刊

VV&A复杂系统仿真摸型计算机仿真设计VV&A complex giant system modelling and simulati

FIR数字滤波器优化算法

针对频率采样法设计FIR数字滤波器速度慢、误差大的缺点，介绍了优化设计法．该方法采用交错定理和瑞米兹算法，以误差的最大值最小为标准，通过叠代使逼近误差在邻域内最小。达到对

期刊

有限冲击响应频率采样瑞米兹算法优化设计finite impulse response window functions remez algorithm

基于强化学习的多机器人避碰算法研究

与本文相关的学术论文