【摘 要】
:
介绍了一种基于先验知识的强化学习方法,它将传统的规则控制方法和强化学习方法相结合,在保留了已知的部分规则的情况下,利用强化学习方法对基本行为的融合机制进行了完善;同
论文部分内容阅读
介绍了一种基于先验知识的强化学习方法,它将传统的规则控制方法和强化学习方法相结合,在保留了已知的部分规则的情况下,利用强化学习方法对基本行为的融合机制进行了完善;同时,利用已知的规则知识对学习器进行指导,保证了学习向正确方向进行,有利于学习收敛速度的提高.文章给出了2种实现方法的结合方式,并给出了学习器的结构及参数和函数设定.最后以机器人围捕为研究背景,实现了移动机器人的自适应式行为融合,并利用仿真实验对其有效性进行验证.结果表明该方法具有收敛快、学习效果好的特点.
其他文献
"千呼万唤始出来,扰抱琵琶半遮面."2001年6月25日,国家经贸委终于向社会公布了机械、汽车、冶金、石油等13个行业的"十五"规划.其中,<汽车工业"十五"规划>最为引人注目.
传统的公路交通收费制度,严重制约了国内汽车市场的发展.中国汽车工业期待着忾车消费政策调整带来的机遇,千呼万唤难出来的燃油税政策已经让众多汽车厂家和消费者望眼欲穿.
学习者具有不同的认知风格,认知风格直接参与并操纵语言学习的基本过程,并对学习者的学习方式和学习效果产生影响.场独立和场依存型认知风格是二语习得中最常见的认知风格,对
文章从设计角度出发,分析了影响汽车机械变速器噪声的因素,阐明了通过控制和优化设计参数,即通过按噪声指标要求合理分配变位系数、增大齿轮副重叠系数、设计齿形和齿向、增
对具有非驱动关节的水平二自由度机械臂系统,提出了基于遗传算法的在全局参数空间内进行全参数寻优的改进分层滑模变结构控制方法.解决了水平欠驱动系统的变结构控制问题以及由
临床上常有一些结核性胸膜炎患者经治疗胸腔内出现分隔, 呈多房性胸腔积液, 进而形成局限性胸膜粘连、肥厚, 甚至形成脓胸, 严重者可导致肺功能减退. 为寻找发生胸膜肥厚的相
康复机器人是目前的热点方向之一.建立了五自由度上肢康复机器人的CMAC神经网络控制模型.在此模型基础上,通过对正常人肌电信号的训练学习,修正了网络的权值,得到了较为理想的控制
杜威(J0hnDewey)作为世界著名的实用主义哲学家和教育家.其职业教育思想也是其思想的精髓所在。本文在重温杜威的职业教育思想的基础上.反思我国职业教育的异化现象.提出职业教育
目的:探讨术前、术后即刻心电图表现与急性心肌梗死(AMI)心肌组织再灌注相关性。方法:对244例急性心肌梗死患者进行术前常规生化指标检测,分别在术前、术后即刻、术后12h ,进行18导
目的:探讨血清N末端B型钠尿肽前体(NT-proBNP)与肌钙蛋白I(cTnI)联合检测对慢性心力衰竭(CHF)患者诊断的临床意义。方法:随机抽取100例经临床确诊为CHF的入院患者作为慢性心