基于神经网络及强化学习的智能控制系统

来源 :西南大学学报(自然科学版) | 被引量 : 0次 | 上传用户:liqwart2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
将神经网络与强化学习结合,提出了一种新型算法模型.该模型应用于智能控制系统中将使智能体具有自主性、高效率、大容量等综合优势.最后,利用计算机软件仿真实验,验证了方案的有效性.本次实验对机器人使用基于试错改进机制的强化学习方式,与传统机器人研究领域大多使用的基于导师机制的监督学习相比,提高了机器人自主适应环境的能力,使机器人更加智能化.同时,将神经网络引入到强化学习中,使该智能系统较其他强化学习系统具有更快的处理信息的速率.
其他文献
在石油天然气工业中,常常使用价格昂贵的银盐来测定各类水中的Cl和CODCr。为了降低分析成本和防止污染环境,文中介绍了将含银废液在pH≈3 时用AgCl 沉淀法分离富集银,然后用铁或铜还原法生成
<正> 在本院89年第2期学报上,本人曾发表了拙文《英汉比喻辞格初探》,试图从对比学习的角度初步探索英汉两种语言在修辞学方面的一些异同,并首先从比喻这最平易常见的辞格入
期刊
氮气泡沫压裂是 70年代以来研究发展起来的一项新的压裂工艺技术 ,它特别适用于低压、低渗和水敏性地层的压裂改造。对氮气泡沫压裂液的基本配方和流变性能进行了室内评价研
案例的结论与刑法教义之间并非完全弥合,而在很多情况下可能存在紧张关系,法官应当将现实社会的需求通过对法律的解释和对刑法教义体系的修正体现出来,以达到在教义学框架内
文章以CNKI企业知识产权管理调查类文献为依据,基于扎根理论,归结了影响中国企业知识产权管理的主要因素,得出"价值能力"是影响企业知识产权管理的核心因素,构建了基于"价值
以节能降耗为目的 ,以热力费用、动力费用之和最小为衡量指标 ,建立了输油管道优化运行的数学模型 ,通过计算机编程运用MDCP法对各加热站的输油温度进行了优化计算。该计算方
<正>数学教材每一册都由若干个单元组成,其中每一个单元的教学内容都可以归于数与代数、空间与图形,或者统计与概率之中。这就使得每一单元的教学都有其自身特点,只要把握了
农业产业化的实质就是农业产业的升级。从另一个角度讲 ,农业产业化也是农村产业结构升级或高度化趋势的一种表现 ;在农业产业化经营条件下 ,选择与农业产业化紧密相联的产业
从蜡梅花cDNA文库中克隆得到1个蜡梅异戊烯基焦磷酸异构酶基因,命名为CpIPI.CpIPI基因的cDNA全长为1 297bp,其中最大ORF框长为879bp,编码292个氨基酸残基.CpIPI蛋白质的相对
膨胀套管技术是 2 0世纪 90年代才兴起的一门节约井眼直径的钻井技术 ,在我国还处于理论探索阶段。用ADINA软件中的弹塑性有限元接触问题建立了可膨胀管膨胀过程的力学模型 ,