一种基于启发式轮廓表的逻辑强化学习方法

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户：wzq558

【摘要】

：

强化学习通过试错与环境交互获得策略的改进，其自学习和在线学习的特点使其成为机器学习研究的一个重要分支．针对强化学习一直被“维数灾”问题所困扰的问题，提出在关系强化学习

【作者】

：

刘全高阳陈道蓄孙吉贵姚望舒

【机构】

：

南京大学软件新技术国家重点实验室,苏州大学计算机科学与技术学院,吉林大学符号计算与知识工程教育部重点实验室

【出处】

：

计算机研究与发展

【发表日期】

：

2008年11期

【关键词】

：

维数灾启发式轮廓表谓词逻辑强化学习 CCLORRL算法 curse of dimensionality heuristic contour list pr

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

强化学习通过试错与环境交互获得策略的改进，其自学习和在线学习的特点使其成为机器学习研究的一个重要分支．针对强化学习一直被“维数灾”问题所困扰的问题，提出在关系强化学习的基础上，引入启发式轮廓表的方法，采用含轮廓表的一阶谓词表示状态、活动和Q-函数，充分发挥Prolog表的优势，将逻辑谓词规则与强化学习相结合，形成一种新的逻辑强化学习方法——CCLORRL，并对其收敛性进行了证明．该方法使用轮廓形状谓词产生形状状态表，大幅度地减少状态空间；利用启发式规则指导动作的选择，减少了样本中不存在状态选择的盲目性．C

其他文献

“三段式”备课使我们尝到了甜头

我校是一所省属重点中学,现有43个教学班,由八位体育教师负责各年级的体育教学工作。为了发挥体育教师的群体优势,全面提高体育教学的质量,我们改革了传统的单兵作战备课方式

期刊

体育教师备课方式集体备课体育教学教学工作重点中学群体优势教案可行性练习手段

阿勒泰严厉打击非法捕猎蒙古兔行动初见成效

近年来，阿勒泰地区各级林业部门加大了野生动物的保护力度，野生动物资源数量普遍增长，蒙古兔数量增长尤其迅速，已经威胁到我区部分县市的农林牧业生产工作。为有效遏制蒙古兔的大

期刊

阿勒泰地区蒙古野生动物资源兔捕猎林业部门资源数量生产工作

健美操课对大学生心理素质的影响

大学生一般都在18—24岁之间,正是生命的旺盛时期,他们的心理趋向成熟,但还有一定的可塑性。教师必须把握这一时机,对大学生进行心理素质的培养和训练。近年来,心理素质的培

期刊

健美操课大学生心理素质心理训练身体练习运动员心理趋向可塑性自觉性心理素质培养心理教育

林业生态建设对拉动内需、促进农牧民增收具有不可替代的作用

当前，为应对全球金融危机，中央做出拉动内需、保持国民经济稳定发展的政策，这给林业带来了前所未有的发展机遇。如何抓住机遇，构建有利于加快林业科学发展的新体制、新机制，实现林

期刊

林业生态建设农牧民增收可替代金融危机国民经济科学发展林业工作林业发展

对创建“五好”管护所建设的认识与思考

森林管护所是林场最基层单位，是生态建设的前沿阵地，是林业产业发展的重要区域，是开展生态文化建设的重要细胞，也是企业兴旺发达的动力源泉。企业的发展目标乃至振兴的各项任务最

期刊

森林管护生态文化建设森林资源管护基层单位产业发展生态建设制度建设环境美化

改善高强高性能混凝土抗裂性能试验研究

通过试验,研究改善高强高性能混凝土抗裂性能措施。结果表明,高强高性能混凝土比高性能混凝土更容易发生塑性开裂,且开裂时间更早、开裂面积也更多。通过采取及时覆盖塑膜养

期刊

高强高性能混凝土塑性开裂养护方式

加快城市绿环建设营造优美宜居环境对新疆城市绿化及防护林体系工程的诠释

1城市绿化及防护林体系工程建设的提出长期以来，在人们的意识中，林业部门介入农田防护林体系、沙漠沿线防沙林等生态脆弱区域的林业建设，没听说林业部门介入城市防护林、城市绿

期刊

防护林体系工程生态环境建设城市绿化新疆农田防护林建设生态脆弱区农田防护林体系诠释

各地贯彻落实第五次全国军转表彰大会暨2009年军转安置工作会议精神

【正】河北:高度重视认真贯彻第五次全国军转表彰大会暨2009年军转安置工作会议召开后,河北省委、省政府高度重视,认真学习领会会议精神,

期刊

军转安置工作军转工作军转干部安置安置任务转业干部移交军队转业干部模范军转干部陕西省军区移交安置离队报到

尚道炳的扶贫路

【正】1999年,尚道炳从湖南省张家界消防支队副团职岗位转业到张家界市中级人民法院工作,报到不久就到贺龙元帅的故乡、国家级贫困县桑植参加建设扶贫,从此,他走上扶贫路,一

期刊

贺龙元帅副团职湖南省张家界国家级贫困县模范军转干部红二方面军扶贫工作人说风景名胜区农家子弟

亲爱的春天（组诗）

有了春天不管历经多少漂泊有了岸就有了脚踏实地的起点不管流浪了多长时间有了家就有了停靠的港湾

期刊

《亲爱的春天》诗歌组诗文学傅玉堂

一种基于启发式轮廓表的逻辑强化学习方法

与本文相关的学术论文