切换导航
文档转换
企业服务
Action
Another action
Something else here
Separated link
One more separated link
vip购买
不 限
期刊论文
硕博论文
会议论文
报 纸
英文论文
全文
主题
作者
摘要
关键词
搜索
您的位置
首页
期刊论文
一类基于有效跟踪的广义平均奖赏激励学习算法
一类基于有效跟踪的广义平均奖赏激励学习算法
来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:zlmgwj006
【摘 要】
:
取消了平均奖赏激励学习的单链或互通MDPs假设,基于有效跟踪技术和折扣奖赏型SARSA(λ)算法,时传统的平均奖赏激励学习进行了推广,提出了一类广义平均奖赏激励学习算法,并时算法
【作 者】
:
陈焕文
谢建平
【机 构】
:
长沙电力学院数学与计算机系,长沙交通学院网络中心
【出 处】
:
计算机工程与应用
【发表日期】
:
2002年1期
【关键词】
:
激励学习
MARKOV决策过程
平均奖赏
有效跟踪
Reinforcementlearning
Markov decision processes(MDPs )
下载到本地 , 更方便阅读
下载此文
赞助VIP
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
取消了平均奖赏激励学习的单链或互通MDPs假设,基于有效跟踪技术和折扣奖赏型SARSA(λ)算法,时传统的平均奖赏激励学习进行了推广,提出了一类广义平均奖赏激励学习算法,并时算法的性能进行了初步的比较实验。
其他文献
运用激光治疗太田痣148例临床观察
目的:观察应用激光治疗太田痣的治疗反应和治疗效果。方法:采用多波长医学激光仪治疗太田痣148例,根据年龄、皮肤颜色选择不同的技术参数进行治疗,间隔3~6月治疗一次。结果:148
期刊
激光
太田痣
疗效
广西鼓励危旧房改造向空中发展
广西壮族自治区建设厅近日出台指导性意见,提出在推进危旧房改造的过程中,在保证改造项目所在区域各项规划指标总体平衡的前提下,鼓励向空中发展。
期刊
广西壮族自治区
危旧房改造
总体平衡
改造项目
手机:终端为王时代来临
谁能料到,曾经是“得渠道者得天下”的手机市场又一次经历着巨大的嬗变。
期刊
手机市场
手机分销
营销模式
定制手机
建立科学合理的征收补偿制度
《土地管理法》和《城市房屋拆迁管理条例》的修改已进入关键阶段,如何完善征收补偿制度依然是社会各界没有达成基本共识的重大问题。农村集体土地和城市国有土地上房屋的征
期刊
补偿制度
科学合理
城市房屋拆迁管理条例
征收
《土地管理法》
农村集体土地
补偿对象
浅谈如何防治砖混结构房屋的墙体裂缝
文章分析了砖混结构墙体产生裂缝的原因,提出了墙体裂缝的处理原则以及避免墙体产生裂缝的防治措施和加固补强措施。
期刊
砖混结构
墙体裂缝
温度变化
地基沉降
Web服务器集群系统QoWS研究
请求负栽的增加常常导致Web服务器系统性能降低,用户期望的服务质量得不到保证,这是服务级Web系统所面临和必须解决的问题。文章提出了一种Web服务器集群环境下的负载分配策略,
期刊
INTERNET
服务质量
WEB
服务器
集群系统
QoWS
负载分配
QoWS
Web Cluster System
Load Distribution
基于VxWorks的嵌入式网管代理在IP电话网关适配器中的实现
IP电话网关适配器是IP GW和PBX结合的产品,跨接在IP网和电路交换网之间。它作为协议格式转换器和数据格式转换器,是IP电话网中比较复杂的部件。SNMP Agent在IP电话网关适配器中
期刊
简单网络管理协议
代理
IP电话网关适配器
管理信息库
VXWORKS
SNMP
Agent
VoIP GW adaptor
MIB
VxWorks
一种新的RAID结构快速扩展方法
担子同一种新的RAID结构扩展方法,其扩展速度大大优于平凡方法,通过仿真实验表明,与标准RAID结构相比,新的扩展方法产生的布局结构只在其些特定的访问模式下性能稍差,而对于常见的
期刊
RAID结构扩展
新增空间散布
访问模式
存储系统
磁盘
计算机
RAID
RAID expansion
new space distributing
acce
宋继东厅长率队督查南宁市“五乱”整治惰况时强调:掀起“城乡清洁工程”新高潮深入推动广西经济社会向前发展
自治区“城乡清洁工程”领导小组副组长、建设厅厅长宋继东近日在南宁市督查“五乱”治理情况时强调,继续加大督察指导力度,充分发动干部群众。再掀“城乡清洁工程”新高潮,以“
期刊
经济社会发展
清洁工程
南宁市
城乡
广西
督查
整治
自治区
面向Agent的分布式多媒体系统分析
分布式多媒体系统是一个复杂的动态系统,传统的面向对象分析方法存在不适应地方,基于Agent的计算以其良好的自适应性,结构的动态优化和智能化的信息处理而广泛应用于分布式计算
期刊
分布式多媒体系统
面向对象分析
多AGENT系统
系统模型
distributed multimedia system
oriented-object anal
与本文相关的学术论文