【摘 要】
:
随着控制论及计算机技术的发展,分布式人工智能中多智能体系统的理论及相关的应用研究已成为人工智能和智能控制研究的热点。机器人足球比赛是一项旨在提高诸多相关领域的研
论文部分内容阅读
随着控制论及计算机技术的发展,分布式人工智能中多智能体系统的理论及相关的应用研究已成为人工智能和智能控制研究的热点。机器人足球比赛是一项旨在提高诸多相关领域的研究水平而举行的国际大型比赛和学术活动,是研究分布式人工智能、智能控制和机器人技术的绝好平台。机器人足球比赛的环境是一个动态、复杂、对抗的环境,并且每个机器人只能得到场上的不完全信息,如何使机器人能通过不断地学习提高自己的性能是开发足球机器人系统的关键内容。本文主要研究强化学习技术在机器人足球中的实现问题。首先,针对机器人足球比赛的环境的复杂性和状态空间的庞大,对已有的基于CMAC神经网络的Q学习泛化学习算法,引入了信度分配的概念,把基于空间的信度分配和基于时间的信度分配同时融合到CMAC-Q学习算法当中,提高了强化学习的速度。其次,对近年来从分层强化学习中发展出来的option算法,结合内在激励思想,尝试性地将其应用到机器人足球中的踢球技术、截球技术和配合技术中去。实验表明,这种算法能够提高球队的决策能力。
其他文献
循环经济作为新的经济范式,以循环利用的资源和环境为物质基础,以生产者、消费者和分解者高效协调的新的代谢方式来满足人类的物质需求,物质代谢就成为循环经济研究的核心问
虚拟现实技术是利用计算机生成一种高逼真的模拟环境,通过多种传感器接口,使用户“沉浸”到该环境中,实现用户与该虚拟环境直接进行“交互”的技术。 虚拟环境是虚拟现实技术
本文以龙格-库塔算法作为研究对象,对实时数字仿真算法进行了研究。首先,本文通过对一般显式RK算法进行稳定性以及误差分析,将实时RK公式的稳定域问题转化为一个约束求极值问
非线性现象是在工程技术、科学研究以至自然界及人类社会活动的各个领域普遍存在的问题。非线性系统辨识成为目前国内外众多学者致力研究的一个热点问题。模糊逻辑和人工神经
本文针对农业部948项目课题“温室生态信息获取及精确施肥灌溉智能控制系统”(项目号2003—Z59)子课题“虚拟仪器温室监测系统”所进行的基于虚拟仪器的温室生态信息采集处理
目前,手机、数码相机、MP3播放机、掌上电脑等手持式嵌入设备在日常生活中应用得越来越广泛,因此,嵌入式领域越来越多的开发者开始投入这些产品的研发。 本文首先简要介绍了
近红外光无创伤检测乳腺癌的研究是国内外生物医学工程界研究的热点之一。1995年至2001年,美国宾夕法尼亚大学研制的“Runman仪”和我校生科院师生与海军工程大学合作研制成功的“TBO乳腺肿瘤检测仪”,在我国国内检测336例乳腺肿块组织血、氧含量,并以“高血低氧”两参数诊断乳腺癌,其敏感性达83.3%,受到医学界的关注。但以上两仪器均采用全光源照射,双滤光片过滤波长,具有体积大,须配置记录仪,无
为了对红外成像跟踪算法进行性能评估测试,本文介绍并实现了一种高帧频红外成像跟踪器及其相应的评估系统接口电路的硬件设计。成像跟踪系统在硬件上采用了DSP+FPGA的架构,对
目前,节能降耗已经成为社会经济可持续发展的重大问题,而智能建筑在给人们提供安全、健康、舒适、高质的生活环境和高效的工作环境的同时,也消耗着大量的能源。建筑空调系统和照