离散时间MDP矩最优模型--折扣依赖于历史的情形

来源 :应用概率统计 | 被引量 : 0次 | 上传用户:xgzyf2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文在S、A(i)(i∈S)均匀可列集情形下,建立了折扣依赖于历史的矩最优模型。给出了折扣总报酬k阶矩在各类策略下的统一表达式;讨论了矩最优策略的结构与性质;证明了矩最优方程在给定条件下,存在唯一的有界解。
其他文献
本文对含有限个瞬时态的拟Q-矩阵给出了诚实Q过程存在且唯一的准则。
提出阴吹可分痰浊中阻、脾肾阳虚、中气不足、湿热下注、肝郁气滞五型,临床上审证求因,施治得法,可获良效。
本文给出了截断数据下非参数回归函数m(x)=E(Y|X=x)的两种估计。在一定的条件下证明了第一种估计的强相合性且给出了第二种估计的强收敛速度。
在有些中成药制剂中,常含有微量汞、砷等有毒成份。本文简要介绍1998年初国际毒理学年会引起广泛关注的关于汞暴露诱发免疫系统攻击自身组织,对T辅助淋巴细胞的非均衡作用会导致降低
本文利用比较简洁的方法研究了线性模型中关于回归系数的一类自适应岭估计的精确偏差和均方误差,并通过对均方误差的分析得到了该估计类一致优于最小二乘估计的充分条件。
将参附 古方制成的参附注射液用于临床,以验证对充血性心力衰竭的疗效。参附组60例与西药组32例作疗效对比。结果:从临床症状的改善及心力衰竭评分结果相比较,参附注射液相总有效率
<正> 1.引言 我国已实行社会主义市场经济,研究市场经济的规律,分析和预测经济的发展是一个重大课题.计量经济学是利用统计方法研究经济及其有关领域中的问题的一门学问.对经
本文讨论了带有干扰噪声的自回归过程Y(t)=X(t)+Z(t),其中X(t)为AR(p)序列,Z(t)、为干扰噪声序列的未知参数φ_1,…,φ_p,σ_g~2,σ_x~2,谱密度f(λ)的估计问题,对所给估计建
本文就特性值服从正态分布N(μ,σ^2),使用综合噪声因子进行参数设计的场合,给出了μ^2与σ^2的无偏估计,并指出了提高σ^2估计精度的可能性,随机模拟结果表明,此时信噪比η的估计也会更接近于