信息的价值在马尔可夫决策理论下的应用

来源 :电子科技大学 | 被引量 : 2次 | 上传用户:chairy01
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在过去的几十年中,随着经济理论、通信工程、企业管理及众多学科中涉及不确定因素和序列性决策问题的大量新模型的涌现,不确定性环境下的马尔可夫决策过程建模理论得到迅速发展。在人工智能领域,马尔可夫决策过程是用来建模规划决策问题的基本理论模型,也是序贯决策的主要研究领域。自古以来,信息和消除不确定性是相联系的。在决策过程中,计算信息的价值的目的是引导不确定性环境下的信息收集过程,提高决策质量,最终实现最优决策。本文的研究工作如下:(1)针对一类需要权衡决策质量和成本的最优不确定性序贯决策问题,建立了一个全新的决策模型——基于信念的价值决策模型(Belief-Based Value of Information,Belief-VOI),通过信息的价值判断决策控制中的最优停止时间,为收集信息的直接成本和这些信息所能提供给未来决策行为的期望收益之间的平衡提供了分析和解决方案工具。(2)本文把Belief-VOI建模理论应用于众包任务质量的决策控制中,详细的推理了建模过程和应用过程,验证了理论的正确性,说明了在决策问题中判定信息的价值的科学性和现实意义。(3)对于在求解一般马氏决策模型的最优策略时面临状态空间过大的不足,本文针对所提出的Belief-VOI模型的特性,研究了效率更高的近似方法,提出了一种基于信念状态的蒙特卡洛采样方法(BMCT),并说明了这种简化方式的可行性和实用性。本文对最优不确定性序贯决策问题和信息的价值在马尔可夫决策过程理论下的应用进行了更深入的探索,实现了人工智能技术在决策分析领域的突破。
其他文献
理论和实践均表明,"恶势力"是黑社会性质组织发展的萌芽雏形,黑社会性质组织是"恶势力"发展的高级阶段。由于恶势力集团属于共同犯罪,与黑社会性质组织有一定相似性,实践中容
改革开放以来,我国城镇化进程取得了巨大的成就。但是我国城镇化进程中名义城镇化率与实际城镇化率差异即"半城镇化率"日趋突出,进城务工和定居的新市民(农民工)与城镇职工收
2002年5月至6月,湖南省龙山里耶镇出土了大批秦简牍,这批简牍涉及内容广泛,引发了学术界的普遍关注。随着《里耶秦简(壹)》对第五、六、八层简牍的公布,为深入研究里耶秦简提
新时期统战文化是在对中华优秀传统文化中的“大一统”思想、“和而不同”的价值观、“肝胆相照”的待友之道和监督制约理论等宝贵文化资源的历史继承中形成的。在新的历史时
学生自身素质方面的提高在培育学生健全人格与促进学生良好发展方面有着极为重要的作用,在初中美术教学中培养学生的创新能力是提高学生自身素质方面发展的必要之举。本文就
通过梳理分析学界对增强高校思想政治理论课实效性的相关文献,提出笔者的一些看法和建议,以期推动高校思想政治理论课实效性的进一步研究,从而能更好地服务于高校思想政治理论课
培训工作是社会主义学校的主要工作,办好各类培训班,培养高素质的统一战线人才队伍,是社会主义学校的首要任务。各州(市)级社会主义学校从实际出发,增强培训工作的针对性,注
聚氨酯(PU)材料是目前应用最广泛的一类高分子材料。由于突出的耐磨性、耐低温性、加工性能良好等优异性能被称为"第五大塑料"。它被广泛地应用在建筑、电子、汽车、医疗器械
当前,我国社会正经历着深刻而复杂的变革,群体性事件已经成为当前和今后一段时期影响我国社会和谐与稳定的突出问题。从法治的视角考察,我国社会还存在着群众法治基础缺失、
在积极老龄化理念下,促进和提高老年人公益活动参与有助于应对我国严峻的老龄化形势。本文基于中国老年社会追踪调查2014年数据,使用干预效应模型处理选择偏差,探析主观年龄