面向语言评价的Takagi-Sugeno模糊再励学习

来源 :清华大学学报(自然科学版) | 被引量 : 0次 | 上传用户：chenbin198718

【摘要】

：

综合考虑再励学习的两个重要子问题 :连续空间及语言评价问题 ,提出了一种新的学习方法 ,即面向语言评价的 Takagi-Sugeno(T-S)模糊再励学习。该学习智能体构建在 Q-学习方法

【作者】

：

晏雄伟邓志东孙增圻

【机构】

：

清华大学计算机科学与技术系,智能技术与系统国家重点实验室,清华大学计算机科学与技术系,智能技术与系统国家重点实验室,清华大学计算机科学与技术系,智能技术与系统国家重点实验室北京100084,北京10

【出处】

：

清华大学学报(自然科学版)

【发表日期】

：

2002年10期

【关键词】

：

再励学习语言评价 T-S模糊推理系统神经-模糊控制函数逼近 Q-学习模糊数

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

综合考虑再励学习的两个重要子问题 :连续空间及语言评价问题 ,提出了一种新的学习方法 ,即面向语言评价的 Takagi-Sugeno(T-S)模糊再励学习。该学习智能体构建在 Q-学习方法和 Takagi-Sugeno模糊推理系统的基础上 ,适于处理连续域的复杂学习任务 ,亦可用于设计 Takagi-Sugeno模糊逻辑控制器。以二级倒立摆控制系统为例 ,仿真研究验证了学习算法的有效性 Considering two important sub-problems of re-energizing learning, such as continuous space and language evaluation, a new learning method is proposed, namely Takagi-Sugeno (T-S) fuzzy re-learning for linguistic assessment. Based on the Q-learning method and the Takagi-Sugeno fuzzy reasoning system, this learning agent is suitable for the complicated learning tasks in continuous domains and also for designing Takagi-Sugeno fuzzy logic controllers. Take the two inverted pendulum control system as an example, the simulation study verifies the effectiveness of the learning algorithm

其他文献

核反应堆厂房的非线性抗震分析

在核工程抗震计算中 ,普遍还是采用线弹性模型进行动力计算 ,但一般结构物在强震中有可能进入弹塑性变形阶段。该文的主要目的是考察结构物在线弹性模型和弹塑性模型下地震响

期刊

核工程抗震计算材料非线性模型

电针对MCAO大鼠血清TNF-α及TGF-β1的影响

目的:探讨电针对大鼠脑缺血再灌注损伤后血清TNF-α及TGF-β1的影响.方法:将健康雄性SD大鼠随机分为假手术组、模型组、电针治疗组.采用改良线栓法制备局灶型脑缺血再灌注损

期刊

电针脑缺血再灌注TNF-αTGF-β1

同信道干扰对多载波CDMA蜂窝系统下行信道的影向

该文主要讨论多载波CDMA蜂窝系统在下行信道中的同信道干扰问题,理论分析了同信道干扰的解析表达式,并通过计算机仿真得出了在一定的传播损耗下多载波CDMA蜂窝系统下行信道的

期刊

多载波CDMA(Multi-Carrier CDMA)蜂窝系统同信道干扰下行信道

非晶As2S3半导体薄膜在激光作用下的性能及结构研究

在激光辐照或退火作用下 ,As2 S3非晶半导体薄膜的光学吸收边出现红移现象 ,并且随着激光功率的增大和辐照时间的延长 ,红移值增大 ,并最后达到饱和。这种红移在先经过退火处

期刊

非晶As2S3半导体薄膜光致暗化光致结晶

飞秒光参量放大过程中高阶非线性效应的影响

用计算机仿真模拟了高强度飞秒激光抽运下的光参量放大(OPA)过程,着重讨论了高阶非线性效应对参量转化效率和波形的影响.为了抑制高阶非线性效应对放大信号光波形的调制,改善

期刊

飞秒脉冲光参量放大高阶非线性数值模拟

HPLC法测定桂杞如意散中阿魏酸的含量

目的:建立桂杞如意散中阿魏酸含量的测定方法。方法:采用高效液相色谱法,以DiamonsilC18(5μm,200mm×4.6mm)为色谱柱,以甲醇-0.5%冰醋酸溶液(27∶73)为流动相;流速为1.0mL/m

期刊

HPLC桂杞如意散阿魏酸质量控制

渐变应变偏振不灵敏半导体光学放大器

采用渐变应变有源区结构 ,制备出偏振不灵敏半导体光学放大器 ,工作电流在 6 0～ 16 0mA范围内 ,其 3dB带宽范围不小于 35nm ,偏振不灵敏度小于 0 35dB ,自发发射出光功率为 0

期刊

应变渐变结构半导体光学放大器大带宽偏振不灵敏

继电保护整定计算软件的通用性和实用性的研究

分析了制约继电保护整定计算及管理软件推广应用的主要原因.从继电保护整定计算所涉及的数据、内容和过程出发,研究了继电保护整定计算的数据表示、数据处理、定值计算方法等

期刊

继电保护整定计算软件平台

110 kV双回线路相继速动保护模拟试验方法

1 双回线相继速动保护双回线相继速动保护原理如图1所示,两条线路中的Ⅲ段距离元件动作或其他保护跳闸时,输出FXL信号,分别闭锁另一回线Ⅱ段距离相继速跳距离元件.

期刊

距离保护相继速动模拟试验继电器

耦合空间声场的简正方式

耦合空间广泛地存在于各类建筑中,具有复杂的声场特性.关于耦合空间已有的研究多是建立在扩散声场的基础上,应用统计理论给出近似的分析.本研究从波动声学出发,从简正频率的

期刊

有限元法简正方式耦合空间finite element methodnormal modescoupled rooms

面向语言评价的Takagi-Sugeno模糊再励学习

与本文相关的学术论文