切换导航
文档转换
企业服务
Action
Another action
Something else here
Separated link
One more separated link
vip购买
不 限
期刊论文
硕博论文
会议论文
报 纸
英文论文
全文
主题
作者
摘要
关键词
搜索
您的位置
首页
会议论文
平均准则TD策略迭代算法
平均准则TD策略迭代算法
来源 :中国运筹学会第六届学术交流会 | 被引量 : 0次 | 上传用户:wyq0221
【摘 要】
:
该文考虑平均堆则模型马氏决策过程的一种改进的策略迭算法—即时差分(TD)策略迭代法。通过引入所谓即时差分的概念,将传统的策略迭代算法的策略赋值步改进为近似策略赋值,相当
【作 者】
:
胡光华
【机 构】
:
云南大学数学系(云南昆明)
【出 处】
:
中国运筹学会第六届学术交流会
【发表日期】
:
2001年1期
【关键词】
:
马氏决策过程
平均准则
即时差分
下载到本地 , 更方便阅读
下载此文
赞助VIP
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文考虑平均堆则模型马氏决策过程的一种改进的策略迭算法—即时差分(TD)策略迭代法。通过引入所谓即时差分的概念,将传统的策略迭代算法的策略赋值步改进为近似策略赋值,相当于将值迭代算法与策略迭代算法进行了折中。最后对所给的TD策略迭代算法的收敛性进行了讨论。
其他文献
马麝隔离种群的生态研究
会议
马麝
隔离种群
种群生态
1.9埃分辨率R-藻红蛋白中色素分子的结构与功能
会议
分辨率
藻红蛋白
色素分子
结构
抑食肼对菜青虫的生理影响
会议
抑食肼
菜青虫
马桑毒素B对试虫体内GABA及Glu含量的影响
用氨基酸分析法测定了粘虫在马桑毒素作用下体内γ-氨基丁酸(GA-BA)及谷氨酸(Glu)含量的变化。结果表明,Glu较对照下降6℅~12℅,GABA的相对含量持续增长。即CL在试虫体内可能干
会议
马桑毒素
体内
相对含量
中枢神经
正常代谢
神经递质
干扰
毒素作用
持续增长
氨基丁酸
抑制性
谷氨酸
分析法
氨基酸
粘虫
传导
测定
折扣-平均混合准则下的向量值MDP
会议
折扣
混合准则
亮氨酸拉链一级序列与四级结构的关系
会议
亮氨酸
拉链
关于AI教育,r大咖这样说r——2020人工智能与创新教育思享汇暨第二届湖南省机器人与人工智能后备人才培养论坛纪实
8月23日下午,2020人工智能与创新教育思享汇暨第二届湖南省机器人与人工智能后备人才培养论坛在长沙举行.本次活动内容丰富、大咖云集,不仅有全能AI机器人云端挑战赛、智慧教
期刊
一天到晚
一车滑出县城的时候,李晓清紧绷的神经松弛了下来,畅快地舒了一口气。过去不开车的时候,总感觉县城的马路好宽。一个人走在马路中间,也没见后面有“嘟嘟”的车喇叭催促。现在
期刊
县城
乌龟
神经
喇叭
昨日重现
Q88888强子是被一阵萨克斯声吵醒的。窗外隔条马路是湖湘公园,每天早晨九点,只要不是天气太坏,都有一支萨克斯准时吹响。这支萨克斯在公园练习将近两年,强子以前工作忙出门早
期刊
萨克斯
公园
强子
准时
音乐
天气
练习
湖湘
隔条
父母
我国马氏钳蝎神经多肽的研究
会议
马氏钳蝎
与本文相关的学术论文