基于强化学习的多机器人协作控制方法研究

被引量 : 8次 | 上传用户:kcl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多机器人协作是研究机器人领域的一项重要课题。由于多机器人协作可以完成单机器人无法完成的工作,因此越来越多的学者专注于多机器人系统的研究。目前对于多机器人系统而言,外部环境复杂多变且其可能面临多种选择,若只提供相对的控制参数,多机器人之间将难以形成有效的协作,难免产生资源浪费和冲突。为促进机器人有效协作和系统优化,研究学者更加注重了机器人自身的学习能力。强化学习算法是近几年发展起来的一种重要的机器学习方法,它是机器人通过感知环境信息来学习系统的最优策略。机器人通过不断的试错和与环境的交互来改善自身行为,从而具有了自主学习的能力,可以有效地完成协作。为此本文对基于强化学习的多机器人协作控制方法进行了深入研究,所做了工作如下:(1)系统分析了多机器人系统的概念和组织行为,采用强化学习理论和方法,研究机器人的路径规划问题。通过试错--评价的在线学习,使机器人选择优化的路径从起点运动到目标点,得到所需的机器人运动行为的规划规则,为进一步研究多机器人系统协作行为的控制方法奠定理论基础。(2)提出多机器人协作围捕的混合强化学习方法。将强化学习系统拆分为两个学习子系统--目标追踪子系统与目标围捕子系统,以解决复杂协作围捕问题,利用模糊逻辑来解决多机器人系统状态空间大的问题,同时引入启发式奖惩函数设计的思想,以提高机器人搜索目标的效率,采用黑板通信与基于协商和意愿强化的协调方法,解决机器人之间的行为冲突,通过面向对象编程技术的仿真试验验证了上述方法的有效性。
其他文献
结合美国协同作战(Cooperative Engagement Capability,CEC)系统、防御系统的最新发展情况,进行了时空统一的需求分析,给出了时空统一的概念、时空统一总体架构以及时空统一处理过
当前,我国的煤炭生产开采进入新的阶段,尤其是露天开采来说,其开采与采空区处理的难度加大。在这种新的形势下,探讨露天开采与采空区处理一体化技术,也就有了重要的意义。在
猪大肠杆菌病是由致病性大肠杆菌引起仔猪肠道的一种传染性疾病,是引起新生仔猪腹泻的最重要原因之一。该文就猪大肠杆菌病的病原、流行病学、临床诊断以及防治措施做一阐述。
有机污染和重金属污染是电镀废水两个最重要的特征,也是限制其治理和循环利用的两大瓶颈。重金属污染一直较受重视,相应的处理技术较为成熟。随着电镀废水新排放标准的出台,
虚拟仪器,是通过仪器软件开发平台如LabVIEW等在计算机的屏幕上模拟出仪器的面板和相应的功能,然后通过鼠标或键盘操作的仪器,在计算机上实现对数据的显示、存储以及分析处理
目的:观察中医穴位按摩对新生儿黄疸指数的影响。方法:将接受治疗的黄疸患儿300例随机分为2组,对照组150例采用常规护理,观察组150例采用中医穴位按摩,记录2组患儿黄疸指数、
进入新世纪以来,为强化政府社会管理和公共服务职能,党中央提出要加快行政管理体制改革,构建服务型政府成为新时期我国政府组织变革与职能转变的宏伟愿景与行动目标。税收作
利用失重法对316L不锈钢纤维在硫酸介质中的腐蚀情况进行了研究,探讨了硫酸的浓度、温度对腐蚀速率的影响,以及硫酸浓度对转变时间的影响。实验结果表明材料的腐蚀速率随温度
具有百年历史的中国油画在多元化的现代艺术格局之下,发生着许多变化。受悠久的历史、渊源的文化以及独特的民族特色等诸多因素的影响,中国油画必须坚持现实主义之路,而且要
静脉产业是一种在资源、能源压力不断增大、环境标准日益严格、环境法规和环境市场需求等共同作用发展起来的新兴产业,其一个发展模式是静脉产业园的建设。静脉产业园是以从