切换导航
文档转换
企业服务
Action
Another action
Something else here
Separated link
One more separated link
vip购买
不 限
期刊论文
硕博论文
会议论文
报 纸
英文论文
全文
主题
作者
摘要
关键词
搜索
您的位置
首页
期刊论文
平均奖赏MDP的在策略无模型激励学习算法
平均奖赏MDP的在策略无模型激励学习算法
来源 :计算机工程与科学 | 被引量 : 0次 | 上传用户:zzyu888888
【摘 要】
:
本文以随机逼近的形式,提出了一些用于求解平均奖赏Markov决策过程系统方程的在策略无模型激励学习算法。这些算法与广泛且成功 应用于折扣奖赏MDP的SARSA(λ)类算法相似。为
【作 者】
:
陈焕文
谢丽娟
【机 构】
:
长沙电子学院数学与计算机系,长沙电子学院数学与计算机系
【出 处】
:
计算机工程与科学
【发表日期】
:
2001年2期
【关键词】
:
激励学习
MARKOV决策过程
平均奖赏
折扣奖赏
人工智能
reinforcement learningMarkov decision process(MDP
下载到本地 , 更方便阅读
下载此文
赞助VIP
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文以随机逼近的形式,提出了一些用于求解平均奖赏Markov决策过程系统方程的在策略无模型激励学习算法。这些算法与广泛且成功 应用于折扣奖赏MDP的SARSA(λ)类算法相似。为比较这些新算法的性能,本文还给出了一些初步的实验结果。
其他文献
通路时延测试综述
随着高速集成电路的发展,以确保数字系统时间特性正确性为目标的时延测试非常重要.基于通路时故障模型的通路时延测试是时延测试研究的主流.本文对目前通路时延测试领域的主
期刊
时延测试
通路时延故障
谈营运资金管理存在的问题及对策--以房地产开发企业为例
随着我国房地产开发企业数量越来越多,竞争越来越激烈,营运资金管理作为房地产开发企业经营的关键环节。如果企业营运资金短缺,企业的投资、建设项目等活动就会受到重大影响;
期刊
上市公司
房开企业
营运资金管理
首届“江西省陶瓷技能大师”评选活动简介
首届"江西省陶瓷技能大师"评选活动是经会员大会共同决定的一项活动。有关评选通知初稿、评选标准、程序等,都是由协会理事会和常务理事会共同拟定并举手通过的。2014年7月14日
期刊
评选活动
江西省
陶瓷
常务理事会
评选标准
艺术家
选通
协会
信息共享探究交流提高团队学习力 ——《长度单位和面积单位的比较》教学案例
我们的数学教学应该在重视基础知识教学的基础上多研究一些学生的创造性学习问题,让学生在做中感悟、发现,变"学算术"为"做数学".学生的"头脑不是一个要被填满的容器,而是一支需被
期刊
信息共享
探究交流
团队学习
教学案例
江苏省农民专业合作社融资的影响因素研究
随着政府对产业结构的不断调整和优化,农业生产逐步向着产业化和规模化方向发展。如何把分散的农户集中起来进行大规模生产是一个技术性难题。而农民专业合作社的功能就是将
学位
农民专业合作社
融资
Logistic回归模型
钟长权陶瓷艺术
钟长权笔名大中,江西省第二届首席技师,江西省高级技师(国家一级技师)。学艺于粉彩非物质文化遗产传承人江汉老师,深造在张松茂大师高研班,张松茂大师研究院研究生。
期刊
陶瓷艺术
非物质文化遗产
高级技师
江西省
研究生
研究院
粉彩
曹明亮陶瓷艺术
曹明亮,1962年7月生。江西省浮梁人。江西省高级陶瓷美术师、江西省高级工艺美术师。1993年毕业于陶瓷职工大学美术系。中国工艺美术学会会员、江西省工艺美术学会会员、江西
期刊
陶瓷艺术
陶瓷美术
工艺美术
职工大学
美术创作
江西省
书画院
收藏家
内联网数据仓库技术及应用
本文讨论了内联网数据仓库技术的需求和实现,提出了由操作数据层、数据提取层、数据仓库层、分析处理层和用户层构成的五层结构的企业内联网数据仓库系统,并详细探讨了建立实用
期刊
数据仓库
多维数据视图
联机分析处理
企业网络
data warehousing
multidimensional data view
OLAP.
液化侧扩流场地桥梁桩基抗震研究进展
震害调查表明,强震下液化侧扩流场地桥梁桩基破坏严重。为此,国内外学者针对液化侧扩流场地桥梁桩基抗震问题开展了大量卓有成效的研究尝试。本文系统总结并评述了液化侧扩流
期刊
抗震分析
桥梁桩基
土-结构相互作用
液化侧向扩流
地震
seismic analysis bridge pile foundations soil-struc
复合式小梁切除术治疗原发性闭角型青光眼的效果分析
目的探讨复合式小梁切除术治疗原发性闭角型青光眼的效果。方法96例原发性闭角型青光眼患者作为研究对象,以随机数字表法将其分为对照组与研究组,各48例。对照组采取传统小梁
期刊
复合式小梁切除术
原发性
闭角型
青光眼
Compound trabeculectomyPrimaryAngle-closureGlaucoma
与本文相关的学术论文