模拟人类发散思维的测度值马尔可夫理论模型

来源 :南京大学学报(自然科学版) | 被引量 : 0次 | 上传用户:keyu1711
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出测度值马尔可夫决策过程新模型.在此模型下,agent对环境的把握用测度概念来表示,于是agent则根据测度来决定自己的最优行动以得到最优策略,因此本文也提供了测度值马尔可夫决策过程的最优策略算法.该模型是部分可观察马尔可夫决策过程的推广,它反映人类思维的一个重要特征,人们在把握全部状态可能性(即对状态空间进行权衡度量)的态势下,思考问题并选择自己的最优行动.部分可观察马尔可夫决策过程只是它的一种特例.
其他文献
<正>在我国古代,见诸文字的自我批评的典型是春秋时期秦国的国君秦穆公。由于称霸心切,秦穆公派孟明视、西乞木和白乙丙三位将领率大军偷偷越过晋国攻打郑国。蹇叔、百里奚苦
职业装是反映个人职业需求以及职业心理的特制的服装,也是企业走向标准化、国际化、品牌化阶段中具备良好形象的体现,能够在各项工作中凸显企业自身的服务理念,也能在业内展
在实现社会可持续发展过程中,环评在环境保护中具有不可替代的特殊作用,面对规划体制改革,应顺势而为实现规划环评升级,全面促进生态文明建设。基于此,本文以规划体制改革背
在丹麦,我常常听人提到“叶特尔法则”。在哥本哈根琥珀博物馆参观时,我不禁好奇地问馆长索恩。索恩微微笑了笑,说:“‘叶特尔法则’是北欧人崇尚的一种平等理念:任何人不得自称比
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
应用基于顺序条件模拟的蒙特卡罗方法,分析不同的先验渗透系数对污染物运移的不确定性影响.研究结果证明渗透系数的条件模拟可大大降低污染物运移结果的不确定性;随着渗透系数条
目的观察产后康复操训练对产褥期妇女康复的效果。方法将自然分娩的健康产妇400例按照随机数字表分对照组和观察组各200例。对照组在产褥早期(产后第2~4天)接受产科常规护理
<正>19世纪末20世纪初,中国社会经历甲午战争、义和团运动和辛亥革命等一系列的政治变动,社会经济也因此发生了深刻的变化,外债和对外赔款急剧增长,不仅使清政府财政危机加深
会议
近几年,政府通过与社会资本在公共服务领域的合作,加快了城市基础设施的建设速度,改善了居民的生活质量,特别是PPP模式在水环境治理项目中的广泛应用,不仅极大的改善了城市面
当前,袭警事件频频发生,警察的人身权、名誉权等屡遭侵害,给公安机关造成了巨大损失,与此同时,警察执法权益保护又面临诸多问题,如法律对警察执法保障不足、社会对警察执法的