逻辑半马尔可夫决策过程及Q学习

来源 :金陵科技学院学报 | 被引量 : 0次 | 上传用户：magicylt

【摘要】

：

增强学习已经开始向关系增强学习发展，并且产生了许多新的算法。这些方法是将命题表达提升为关系或计算逻辑的表达。提出了一种新的表达形式，称为逻辑半马尔可夫决策过程。它是

【作者】

：

王蓁蓁王智钢

【机构】

：

金陵科技学院信息技术学院,江苏省信息分析工程实验室

【出处】

：

金陵科技学院学报

【发表日期】

：

2013年2期

【关键词】

：

关系增强学习半马尔可夫逻辑半马尔可夫决策过程 relational reinforcement learning semi-Markov logica

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

增强学习已经开始向关系增强学习发展，并且产生了许多新的算法。这些方法是将命题表达提升为关系或计算逻辑的表达。提出了一种新的表达形式，称为逻辑半马尔可夫决策过程。它是将逻辑程序与半马尔可夫过程相结合。在此框架中，抽象（状态或行动）是至关重要的，并且提出了对于逻辑半马尔可夫决策过程的Q一学习算法，给出其收敛证明。这种框架对在关系增强学习发展中处理时间连续方面提供了一个合理的基础。

其他文献

基于物联网的3D RGB光立方控制系统设计

设计了基于物联网的3D RGB光立方控制系统,实现了对组合式彩色LED光立体的无线控制,其中通过手机APP设计显示图案,通过单片机控制无线传输模块接受APP传输的显示图案并控制LED立方体显示3D效果。该系统能实现三维真彩色立体动态显示各种图案、以3D RGB LED光立方为单元任意组合光立方的大小,具有光通量一致性好、能远程控制,可实时修改图案的优势。APP控制界面操作简单直观,通过物联网无线控

期刊

3DRGB光立方物联网控制系统3D RGB light cubeinternet of thingscontrol system

基于词典的服务语义标注和匹配算法

万维网服务语义标注和匹配算法的研究成果大都是基于本体技术,但存在复杂度高等不足。提出了用描述概念特征的特征词集的语义相似性计算来间接判断概念的相似性方法,并以此方

期刊

语义词典语义万维网服务本体semantic dictionary semantic web services ontology

含一个未知边界的抛物型方程反问题稳定数值算法

在物理学中模拟均匀的多孔介质流时会遇到一类一维抛物型反问题,该问题由一个含一未知边界条件的抛物型方程以及在某指定内点上测量得到的特定数据条件所构成。为了能够更好

期刊

一维抛物型方程反问题有限差分格式稳定性one-dimensional parabolic equation an inverse problem f

逻辑半马尔可夫决策过程及Q学习

与本文相关的学术论文