【摘 要】
:
机器学习是近年来兴起的一门多领域交叉学科,其涉及到统计学、概率论、凸分析、逼近论和算法复杂度理论等多个学科。在机器学习理论中主要涉及到设计并分析一些可以让计算机
论文部分内容阅读
机器学习是近年来兴起的一门多领域交叉学科,其涉及到统计学、概率论、凸分析、逼近论和算法复杂度理论等多个学科。在机器学习理论中主要涉及到设计并分析一些可以让计算机具有自主学习能力的算法。而机器人足球比赛是目前机器人研究中的应用课题之一,其涉及到了人工智能、智能控制和图形图像处理等多个领域。机器人足球比赛具有实时性、分布性、异步性、动态性等特点,它是一个标准的分布式人工智能研究平台。对机器人足球比赛进行模拟仿真不仅可以节省资金,而且方便人们研究算法的性能。增强学习不需要先验知识,实体可直接通过与环境进行交互获取知识并修正行为策略,这些特性使增强学习在机器人足球比赛中获得了广泛应用。本文研究基于增强学习的机器人足球比赛算法和仿真,主要工作如下:1,分析了增强学习的基本原理,着重研究了 Q-Leaming算法、瞬时差分算法和SARSA算法。在此基础上,结合机器人足球比赛的特点,提出了一种改进的SARSA算法。2,分析和搭建了机器人足球比赛的仿真软件平台MSRS,对仿真中的增强学习算法进行了奖励函数和行为函数的设计,并讨论了行为选择方法和状态离散化等问题。3,对改进的SARSA算法在机器人足球比赛的单实体环境下进行了仿真分析,在此基础上,比较了 SARSA和改进的SARSA算法在多实体环境之中的性能,仿真结果表明,改进的SARSA具有更多的智能体控球时间。论文通过机器人足球比赛仿真平台,研究了增强学习算法,仿真结果表明,应用增强学习算法可以更好的制定机器人足球比赛的策略。
其他文献
注CO2置换法目前被认为是一种最有发展前景的水合物开采技术,既能开发天然气又能以固态水合物形式封存温室气体,同时也不会破坏地层的稳定性。但纯CO2来源少,电厂烟气的主要
作为一种超低辐射剂量CT冠状动脉造影(coronary computed tomography angiography,CCTA)技术(低至约1m Sv),第二代双源CT所特有的大螺距前瞻性心电门控螺旋扫描模式(prospect
目的旨在分析国内亚急性甲状腺炎(SAT)的误诊现状、原因并制定相应对策。方法回顾性分析国内近20年中国知网学术期刊数据库(CNKI)收录的文献,总结SAT被误诊的年龄、性别比例
SPWM控制方式有3种,一种是通过模拟电路控制,一种是通过数字电路控制,还有一种是通过前两者相结合的方式控制,通过SPWM控制技术可以减少输出电压中的谐波含量,可以有效的减少
<正>为深入落实《深化政府采购制度改革方案》要求,依法加强和完善政府采购监督管理工作,规范政府采购代理机构执业行为,进一步优化政府采购营商环境,财政部日前印发通知,从2
研究目的及背景:卵巢癌是女性生殖器官常见的恶性肿瘤之一,浆液性卵巢癌(SOC)占卵巢上皮癌绝大部分,其中高级别浆液性癌,恶性程度较高,预后较差。卵巢癌患者经治疗后,往往存在化疗复发、多重耐药的情况。因此,研究卵巢癌发病机制,发现早期监测指标尤为重要,可以为进一步指导临床治疗打下基础。CYC1(Cytochrome c-1)是线粒体复合体III的重要亚单位,在生物氧化过程中,可发生组织氧化还原的迅速
<正>2017年11月5日,由南开大学中国财富经济研究院、北京师范大学收入分配研究院及凤凰财经研究院主办的"中国收入分配50人论坛:落实十九大精神探讨中国居民收入分配现状与问
爱因斯坦的广义相对论预言了黑洞的存在,但由于黑洞的一些特性使得对它的探测极为困难。人们在某些双星系中发现了致密天体,分析表明这些天体的质量远远超出了广义相对论中任
目的 探讨能谱CT最佳单能量图对提高下肢动脉造影成像质量的应用价值。方法 前瞻性的将符合纳入标准的34例下肢动脉硬化闭塞症(LEAOD)患者随机分为研究组和对照组。研究组采
《一滴水经过丽江》选自人教部编版教材八年级下册第五单元的第四篇课文。游记单元,是第一次进入初中语文教材。本单元收录的四篇课文为风格、写法各异的游记。本文出自名作