马尔可夫决策过程复杂性的熵测度

来源 :控制与决策 | 被引量 : 0次 | 上传用户:healtw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
应用Shannon熵和其他熵指数来度量马尔可夫决策的复杂性.将马尔可夫链的复杂性、不确定性和不可预测性的度量扩展到马尔可夫决策,提出一套基于信息理论的复杂性度量方法,可用于随机和确定性策略下的完全观测和不完全观测马尔可夫决策.对有关数值进行仿真研究,并给出了计算结果.
其他文献
背景与目的:肝细胞癌(hepatocellular carcinoma,HCC)是死亡率极高的原发性肝癌,其恶变的机制目前尚未明确。近些年随着对自噬研究的深入,发现自噬可以提供肿瘤生长高能量的需求
1故障现象无创血压开始起动,但到一半还没有得出测量结果就中途停止,气泵电机不能转动,其它各项正常.2检修过程经检查,电机完好,但是电路板上有一只晶体管非常烫手,过一会待
利用Tabu搜索的强大局部搜索性能,提出一种新的非线性遗传算法.该方法将Tabu搜索技术内嵌于遗传算子中,构造了基于Tabu搜索的非线性杂交及变异算子,它能有效地提高算子的局部
近年来我科采用以颈椎定位反调手法为主治疗颈肩综合征89例,获效满意。现报道如下。
在复杂系统的质量生存交互决策中,为获得最大质量生存函数W*,通过研究离散质量生存决策及离散系统有限化过程,给出了最大质量生存函数W*的递归数值算法,并完成了有限近似解的
煮沸灭菌法仍是目前麻醉器具的常用消毒、灭菌方法,根据水煮沸(达到100℃)后方开始消毒计时的要求,并充分考虑节约能源,我们经过反复研究、实验,研制成功了一种全自动节能型
针对含有高阶不确定扰动项且不可参数线性化的一类非线性系统,采用反步递推方法设计基于多层神经网络的自适应控制器.多层神经网络可较好地逼近非线性系统,其权值能在系统先
以轧管厂为核心,设计出6条排产规则实现了轧管厂的优化排产,并提出一种启发式的排产方法,在保证炼钢厂(管加工厂)生产计划可行的前提下,尽可能地实现炼钢厂(管加工厂)的优化
根据总部要求,在总后卫生部医学计量管理办公室领导下,全军医学计量中心于2001年下半年成功地组织了全军医学计量三级站的考核验收工作,现将考核情况及有关问题作一回顾和展