基于知识的Agent强化学习算法分析与研究

来源 :电子设计工程 | 被引量 : 0次 | 上传用户:xingredients
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
强化学习具有与环境交互的优势,笔者提出的基于知识的Q-学习算法(KBQL)就是利用Q-学习算法的这个特点,利用Agent的先验知识来缩小Agent学习的状态空间,以加速强化学习的收敛性,同时采用Agent的学习机制克服其知识的不精确性,从而提高学习算法的鲁棒性和适应性。
其他文献
论述了截获因子和信号分选在验证雷达信号性能的重要性。提出了通过截获因子对雷达信号低截获性能的验证,衡量其低截获性能的办法。提出了通过分选来验证雷达信号的识别程度的
随着互联网时代下信息技术的快速发展,学生的学习渠道也变得更加自主化.单一的传统体育教学理念已不能适用于高等学校体育教学,信息技术手段在体育教学中的逐步应用对大学体
文章以广西来宾至马山高速公路为依托,以第二合同段K303+900深挖路堑边坡为例,通过查明边坡现状危害性、分析评价边坡稳定性和破坏形式,提出边坡防治建议措施,为设计方案提供
运用实验法、数理统计等研究方法对农村留守儿童进行心理干预研究,农村留守儿童因家庭教育的长期缺失,致使这些留守儿童存在着诸多心理问题.本研究以农村留守儿童的心理现状
目前,电子海图显示与信息系统(ECDIS)已经是船舶导航的主要设备。电子海图极大地提高了船员的工作效率、降低了船员的工作强度,是航海技术的飞跃,而我们正是这个飞跃的实践者
在介绍发酵床养猪的概念与优点的基础上,详细阐述了养猪场发酵床的建造、日常管理及维护等技术要点,以供养殖者参考。
2015年,在会员单位的大力支持下,学会共征集论文135篇,经审稿后,在《航海》杂志上刊载。学会注重学术质量与学术道德,宁缺毋滥,组织相关学术及管理人员以无记名投票方式,初选20篇论文入围,邀请业界知名专家学者组成评审会。来自不同专业领域的专家评委进行了客观、公正的评审。评审会认为,本次征集的论文较好地体现了理论研究与生产实践相结合的指导思想,对现实工作具有一定的指导意义和参考价值,助推上海国际航
黑头粉刺痣(comedo nevus)是一种以单侧分布的先天性毛囊发育异常,外观表现为群集的黑头粉刺样丘疹性损害;组织病理学表现为表皮形成宽而深的凹陷,凹陷内充满角质栓。本病临床少见
文章应用灰色关联度分析理论,分别从胶结料和级配、油石比及空隙率两个角度对橡胶沥青混合料高温性能影响因素进行敏感性分析,找出评价橡胶沥青混合料高温性能的主要指标,为
在数据加卸载系统上,为了防止对数据的非法操作,需要数据加卸栽卡具备一定的安全验证功能。本文在分析USB批量传输协议的基础上,设计了数据卡的固件程序状态机,在固件程序中增加