【摘 要】
:
本文提出了基于模糊自适应评价 (FL AC)的增强式学习 (Reinforcement L earning)控制系统 (FL AC/ASN) ,FL AC采用模糊规则表示学到的知识 ,因此可以有机地融入专家的经验。
【机 构】
:
中国纺织大学自动化系!上海200051,中国纺织大学自动化系!教授博士生导师上海200051
论文部分内容阅读
本文提出了基于模糊自适应评价 (FL AC)的增强式学习 (Reinforcement L earning)控制系统 (FL AC/ASN) ,FL AC采用模糊规则表示学到的知识 ,因此可以有机地融入专家的经验。 FL AC的学习方法为瞬时微分法 (TemporalDifference)。作用选择网络 (ASN)采用多层前向网络。仿真结果表明 (FL AC/ASN)具有很好的学习性能
In this paper, FLAC / FLN (Flex AC / ASN) based fuzzy adaptive evaluation (FLAC) is introduced. FL AC uses fuzzy rules to represent the knowledge acquired, so it can organically integrate the experience of experts. FL AC learning method for the instant differential method (TemporalDifference). Role Selection Network (ASN) uses a multi-layer forward network. Simulation results show that (FL AC / ASN) has good learning performance
其他文献
唐山LNG在能源综合利用上进行深化优化,采取了系列节能减排技术。LNG储罐选择全容式混凝土顶储罐;选择再冷凝蒸发气体的处理工艺,选用开架式海水汽化器与浸没式气化器相结合,
主要针对当前公安机关监控系统应用维护工作的实际情况,分析了监控设备故障检测的现状,并提出了解决方案。
本文建立了船用二氧化碳跨临界循环制冷系统的稳态仿真数学模型,用此模型计算和分析了内部和外部参数分别变化时跨临界二氧化碳制冷系统的工况特性.本文的研究结果可为跨临界
针对在实用中判别H-矩阵的困难性,通过对矩阵行标作划分的方法,给出了判定非奇异H-矩阵的一组新条件,改进了近期的相关结果,并给出其在神经网络系统中的应用。相应数值示例说
在中央集权等级授权制下,宋代地方官员的主体皆由中央直接任命,从中央到地方贯彻的是“与士大夫治天下,而非与百姓治天下”的治国原则,“足上供”是地方官员和地方行政最主要的、
采用PCR-RFLP法对苏太猪SLA-DQB基因外显子2的PCR产物进行分析,结果显示,SLA-DQB基因外显子2经RsaⅠ酶切后,共分出4种基因型;经HaeⅢ酶切,共分出3种基因型。χ^2适合性检验结
计算机技术在现代社会的各行各业发展中都已经成为了最普遍的应用工具,但是网络环境存在着许多的威胁,还需要采取措施进行网络防御。基于此,本文针对计算机网络防御现状进行
通过eBeePlus免像控无人机航空摄影测量系统应用于1∶500地形图测绘工程实例,探究其在实践中的制图精度及适用性。使用emotion3、Pix4dMapper等软件进行外业航飞、内业影像处
一、股票溢价之谜说西方金融学家关于股票溢价之谜的典型例证是,有一位在1926年结余有一小笔钱并以合理的期望,期待他将会有两个第三代诞生并准备遗赠给他们两个各1000美元的人,做了如下
致密油储层的孔喉细小、渗透率低,使得开发难度较大,但是以毛管力为基础的静态渗吸作用对致密油的开采十分有利。利用自行研制的静态渗吸实验测量装置,进行了大量室内实验,研