基于强化学习的Modelica模型参数辨识技术研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:alpaalpa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Modelica作为一门面向多领域统一建模的语言,目前已经成为多领域建模领域的事实标准。对一个Modelica模型而言,参数的准确与否直接决定了模型的有效性,因此标定参数是创建模型过程的关键一环。现有的标定方法以基于手册或经验知识的人工试凑法为主,标定过程繁琐且不能保证参数的准确性;利用最小二乘估计、粒子群等算法对模型参数进行辨识在一定程度上提高了参数标定的速度和精度,但依然存在着易陷局部最优、数学形式复杂等问题。因此,对Modelica模型参数辨识的研究十分必要,本文针对模型的参数辨识算法和整体辨识方案开展了研究。论文基于现有的辨识算法CARLA进行改进并提出了ECARLA算法,主要有三个改进点,其一是使用正态随机数发生器代替积分操作,提高收敛速度;其二是引入随机性,尽量避免局部最优;其三是将公共奖励因子改为私有奖励因子,消除灵敏度差异导致的学习偏差。论文在传统强化学习算法Q-Learning的框架上进行扩展并提出了EQL算法,针对参数辨识问题特性自行设计了奖惩函数、动作选择策略和Q值表更新策略,并提出了“训练周期——优化回合——搜索周期”的三重循环串行学习流程,以避免无意义的动作试错,提高算法的收敛速度。论文提出了“三阶段辨识”的参数辨识方案。第一阶段使用Sobol方法和蒙特卡洛采样分析待辨识参数的灵敏度;第二阶段为使用ECARLA或EQL算法对模型进行初步的参数辨识;第三阶段使用粒子群算法对模型进行最终的参数辨识。在此基础上,形成了“灵敏度分析+EQL+PSO”和“ECARLA+PSO”两套模型参数辨识方案。最后,论文设计并实现了一套模块化的参数辨识系统,通过案例分析验证了辨识算法及方案的有效性和适用场景。
其他文献
钙钛矿太阳能电池作为一种新兴光伏技术,凭借优异的光电性能、简单的溶液制备工艺获得了广泛关注和迅速发展。其中,基于Ti O2/Zr O2/Carbon三层介孔膜结构的可印刷介观钙钛矿太阳能电池展现出良好的稳定性和易于大面积制备等优势,极具应用前景。目前,该类型钙钛矿太阳能电池的光电转换效率仍低于传统结构钙钛矿太阳能电池,这主要是由于其开路电压较低。本文围绕提升可印刷介观钙钛矿太阳能电池的开路电压和光
激光雷达目标检测和跟踪是三维感知的核心环节,目标检测的准确度和目标跟踪的精确度共同决定了三维感知效果的上限。一方面,基于激光雷达鸟瞰图的目标检测方法开创性地将二维图像检测方法应用到三维目标检测,在激光雷达目标检测领域得到了广泛应用。然而,该方法在将点云投影成鸟瞰图的过程中,损失了点云高度信息和激光点之间三维空间位置信息,目标投影图像很容易和周围环境混淆,造成目标检测准确度低的问题。另一方面,基于扩
锁具是人们日常生活中必不可少的一种器具,用于保护人们的财产和隐私。中国是世界上最早发明和使用锁具的国家之一,早在仰韶文化时期便有了锁具的雏形,到了汉朝时已有了结构完善的簧片结构锁。随着时代的进步发展,中国古锁也在不断的发展演变,融合了各民族特色,孕育出了独特的文化价值。古锁从最初的保护财产功能的出发,延伸出了许多的象征意义和审美情趣,有着极高的文化趣味。清朝末期,安全性能高,内部结构优良的弹子锁随
石碑是一種用作紀念或標記的豎石,石上多有文字或圖畫鐫刻,其意在於久遠留存,主要立在陵墓、宮殿、寺廟、等地以作記事之用,在形製上多由碑首、碑身、碑座三部分組合而成。最早的石碑可追溯到先秦時期專門用作觀日影測時的石柱,或是用來系牲畜的石柱,用在禮儀制度上為多,且刻寫文字情況較少。秦代稱這種豎石為刻石,開始鐫刻文字,作用開始從禮義制度中的一部分向專門的記事頌德方向轉變,至漢代才開始專門稱這種刻石為碑。魏
LiMP04(M=Fe,Mn)作为目前应用最为广泛的动力电池正极材料之一,伴随对新能源汽车的需求越来越大,对电池电化学性能要求也越来越高,急需新一代高电位电极材料。有研究证实过渡族元素的M位替换能提升材料电导率,但其作用机理尚不明确。稀土材料价格昂贵,利用其进行掺杂改性的报道较少,理论计算方式避免了由于存在大量具有可能性的材料而给实验带来的盲目性,节约了成本,缩短了周期。本文首先利用密度泛函理论计
吻合口漏是直肠根治术后最常见也是最危险并发症之一。由多种原因所致,吻合口漏的发生率有大致在1%-28%之间【1-8】。吻合口漏的发生给医患双方都带来人力,物力,财力等多重负担,严重的吻合口漏能引发其他并发症甚至会危及患者生命【9-11】。据文献报道,严重吻合口漏所致的围手术期死亡率可高达15%-30%【12-14】。虽然医疗技术日益进步,医疗设备日益完善,但是随着全直肠系膜切除的广泛开展以及患者对
目的:制备一种可注射温敏性天然高分子水凝胶,用于骨软骨修复,促进骨软骨生成。方法:1)材料制备与性能表征:配制质量比为m(HA)/m(HPCH)=1:6和m(HA)/m(HPCH)=1:12两种配比的HA/HPCH水凝胶,凝胶浓度均为2%(m/v),并分别命名为HA/HPCH-1和HA/HPCH-2。用场发射扫描电镜(SEM)观察凝胶样品HPCH、HA/HPCH-1、HA/HPCH-2的表面形貌。
路径是一条连接起点和终点的曲线或者离散序列点,生成这一串曲线和序列点的过程就叫做路径规划。通常,路径规划由两部分构成——环境模型和路径生成算法。目前强化学习的研究热点是在虚拟环境中让智能体完成各种各样的任务,研究者们已经能够让智能体在视频游戏里面表现优异,例如在星际争霸等复杂的游戏环境中的表现已经远超人类的水平。在虚拟环境中训练强化学习的模型也需要考虑两个要素——虚拟环境和强化学习算法,这一点与路
超声换能器在超声焊接、超声切割和超声加工等功率超声领域应用广泛,而超声换能器在工作过程中,随着温度、环境等因素的变化会导致其谐振频率产生漂移,因此实现频率自动跟踪是超声换能器能高效、稳定工作的关键之一。本文从频率自动跟踪角度出发,以STM32微控制器为主控核心,结合直接数字合成芯片AD9833,设计了超声换能器的并联谐振频率自动跟踪系统。本文的研究内容主要包括:1.分析了超声换能器在其并联谐振频率
大肠杆菌是人和动物肠道内的常驻共生菌及机会致病菌,同时也是耐药性的指示菌。我国正受到日益严重的细菌耐药性的威胁,客观、准确的掌握国家或区域内细菌耐药现状对国家制定合理的降低细菌耐药危害的策略以及提高疾病防治效益意义重大,目前国内关于动物源细菌耐药的报道研究较多,但较为零散不系统,未见应用科学的统计分析方法进行系统评估不同动物、药物、养殖状态、时间、地区等条件下的耐药状态,本研究应用Meta分析方法