基于强化学习的多机器人避碰算法研究

来源 :信息技术 | 被引量 : 0次 | 上传用户:dajiange
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
采用强化学习解决多机器人避碰问题。然后针对表格式Q学习算法只能用于离散的状态并且学习时间过长,难以收敛的不足,提出了神经网络和Q学习相结合的算法。最后将该算法应用到多机器人避碰问题中,仿真实验表明该算法有效,能较好地解决多机器人避碰问题。
其他文献
为了方便地管理无线传感网络,文中以工厂生产环境监控为例提出了一种新的层次型的无线传感网络控制系统,该系统具有很好的系统移植特性及扩展特性,经测试证明,该系统具有较好
德育教学在学校教育工作中占首要地位,这是无可非议的,但在大多数老师中则认为德育教育只是在思想品德课、语文课的教学中才能进行,寓德于教。或在班队课中对学生进行德育教育,这
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
针对大庆油气处理厂管理自动化水平不高,影响经济效益的问题,提出将LonWorks 现场总线控制系统与信息管理系统相结合,形成油气处理厂生产管理综合自动化系统设计模式,并详细
It is difficult or even impossible for a pure mathematical model to represent a complex giant system because of the complexity, activity, uncertainty in such a
针对频率采样法设计FIR数字滤波器速度慢、误差大的缺点,介绍了优化设计法.该方法采用交错定理和瑞米兹算法,以误差的最大值最小为标准,通过叠代使逼近误差在邻域内最小。达到对