一种基于独立任务的POMDP问题的解决方法

来源 :计算机应用研究 | 被引量 : 0次 | 上传用户:xxbear0
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
通常利用POMDPs对在部分可观测的随机环境中决策的agents建模。针对完整POMDP的求解方法扩展能力弱的问题,提出把多元POMDP分解成多个受限制的POMDPs,然后独立求解每个模型,以获得值函数,并将这些受限制的POMDPs的值函数结合起来以便获得完整POMDP策略。该方法主要阐述识别与独立任务相关的状态变量的过程,以及如何构造被限制在单独任务上的模型。将该方法应用到两个不同规模的岩石采样问题中,实验结果表明,该方法能够获得很好的策略。
其他文献
针对传统压缩感知(CS)方法抗噪性能差的问题,提出了一种新的基于压缩感知的语音增强识别系统。该系统在用正交匹配追踪(OMP)算法重构语音信号时设定相关度闽值和语音恢复阈值,并对
结缔组织病(CTD)如系统性红斑狼疮(SLE)、进行性系统硬化症(PSS)、结节性多动脉炎(PAN)、皮肌炎(DM)、白塞氏病(BD)、干燥综合征(SS)、类风湿性关节炎(RA)、重叠综合征(OLS)、混合性结缔组织病(MCTD)等,往往因多器官损害...
软件易变性预测主要通过软件的内部特性,即软件度量值来刻画、预测的,是软件工程中热点方向之一,在提高软件质量、控制软件成本方面起着非常重要的作用。虽然软件易变性预测在学术界取得了一系列的成绩,但在工业界尚未有成功应用的案例。从简单相关性分析与偏相关性分析和关联规则挖掘的角度出发甄别面向对象度量与软件易变性间相关性的真伪,明确了在软件易变性上下文中类规模对面向对象度量有潜在影响。
针对稀疏码多址接入(SCMA)码本设计复杂度高的问题,提出了一种基于高斯信道下的码本设计方案,先设计每个资源块上所有用户的总星座图,然后利用网格编码调制(TCM)中的子集分割法生成各用户对应的星座,结合低密度扩频序列生成星座矩阵,最后由星座矩阵对应生成用户码本。该方案不仅保证了用户之间的星座点间最小欧氏距离最大化,同时保证了用户自身星座点间最小欧氏距离最大化。仿真结果表明,应用所设计的码本,系统的
骨外露创面,只要不是面积很小,一般都需手术治疗。其手术方法也很多。本文报道13例手部小面积骨外露齿创面的修复,是对骨外露者,未先作骨钻孔,或去除骨皮持,扩地, 用皮覆盖。及多指节
现有重叠社团发现算法大多直接从相邻连边的相似性出发,不能有效利用网络的多层连边信息,基于此提出了一种基于连边距离矩阵的重叠社区发现算法LDM。首先结合连边—节点—连边随机游走模型,以实现多级连边信息的有效利用;借助模糊聚类方法,处理连边距离矩阵以获取连边社区;最后根据扩展模块度调整和优化重叠社区结构。在人工网络和真实网络上的实验结果表明,所提算法能够有效提高重叠社区发现算法的准确度。
本文介绍了新研制的“轨道方向不平顺检测装置”的工作原理和系统组成,特别对惯性但移测量中加速度信号的测量。补偿及修正,模拟数字混合处理方法,高速信号处理器数据处理流程,以
本文叙述了机车轮对轴在承脂的研究过程,在此项工作中,针对我国机车轴承结构,运用及检修特点,以符合美国GE公司规格,居国际先进水平的Exxon公司生产的Ronex.MPNo.2多效极压锂基脂为对比,经一系列试验室
泥石流流量计算对泥石流防治工程的规划设计和灾害评估都是很重要的问题。本文提出的一种计算方法属雨洪修正法。与以往的方法相比,它的特点是根据沟床形态和转移能力来估计泥