基于强化学习的足球机器人决策系统设计

来源 :中南大学 | 被引量 : 0次 | 上传用户:xjc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
足球机器人是当前机器人研究中的一个热点,涉及机器人学、人工智能、智能控制、计算机视觉等多个领域。决策系统作为整个足球机器人系统的核心,决定了机器人间的协调协作,是机器人的“大脑”。因此,决策系统的研究在多机器人、多智能体领域具有十分重要的意义。本论文以足球机器人Mirosot 5v5仿真比赛为研究对象,针对传统的决策模型很难满足足球机器人系统在反应性、适应性、智能性和学习能力等方面的要求,提出一种基于改进O学习的足球机器人两层协作模型。该模型把整个决策系统分为上下两层:协调层和运动控制层。上层协调层针对普通Q学习在环境状态复杂的情况下收敛速度较慢的缺点,通过分析足球机器人比赛的特性,采用模糊聚类的方法把数量众多的系统状态转化为为数不多的模糊状态,从而大大减少了Q学习的状态空间,提高了算法的收敛速度;同时,针对普通Q学习算法易收敛到局部最优,本文通过分析Q学习算法中三个关键参数(学习率α、折扣因子γ和温度值T)的作用,提出一种自适应Q学习算法,动态地调整这三个参数,从而实现系统全局最优动作。下层运动控制层,取代传统的机器人作为上层意图的简单执行方法,将下层机器人的控制设计成为一个智能体,主要设计了三个角色的智能体:防守队员、进攻队员和助攻队员,从而减轻协调层的决策任务,提高了系统的实时反应性。本文采用C++编程语言在Windows下编写动态链接库(DLL)程序来实现整个决策子系统的设计。通过在MiroSot足球机器人仿真平台上进行仿真比赛,验证了所设计模型的有效性。
其他文献
计算机随着时代的发展应运而生,现阶段,高职院校进行计算机教学的主要方式是任务驱动法,学生通过老师的指导,完成老师布置的任务,在这个过程中,获取知识和技能,在高职计算机
一般来说,配电网运行质量能够对国家电网运行体系起到决定性作用,因而配电网设备状态检修及运维管理工作是供电单位关注的重中之重.电能作为特殊商品,电能的输送需要经过不同
预计将有来自世界50个国家和地区的大约1200家公司参展,来自90个国家的40000多名观众将到会参观。KORMARINE 2015时间:2015年10月20-23日(两年一届)地点:釜山展览中心(BEXCO)
随着课程改革和创新素养的不断深入,教育工作者越发注重学生综合素养与能力的发展.在数学学科教学中,因为知识点的抽象性和复杂性,加之小学生的思维认知能力尚不成熟,导致他
期刊
随着当前我国网络技术以及计算机技术的广泛应用,对于长江航运产生了很大的影响.其航运管理单位和企业也在逐渐的朝着信息化以及电子化的方向不断的前进,在航运单位的管理工
质子交换膜燃料电池具有比功率高、工作温度低、发电效率高、噪声低、零排放等优良特性,受到了世界各国的广泛关注。开展燃料电池发动机系统建模与控制研究是提高燃料电池发动
在当前信息化时代背景下,电子通信已成为人们日常生活中较为重要的一项内容,有效的提高了信息传递效率.在电子通信过程中,电磁技术是较为重要的一项技术,特别是电磁场和电磁
随着素质教育理念在我国职业教育体系内的不断深化,高职信息技术课程作为我国高等职业教育体系内的重要组成部分,对学生的发展越来越重要,这是因为高质量的信息技术课程不仅
Web Service就是一组位于远程服务器上的函数库,通过这些函数库客户端可以通过Web访问这些服务器端的service,物联网是建立在计算机互联网和通信技术的基础上,利用射频自动识