基于增强学习解决随机需求车辆路径问题

来源 :系统仿真学报 | 被引量 : 0次 | 上传用户:jo0909
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对确定随机需求车辆路径问题的最优策略,存在状态空间“维数灾”问题,基于增强学习函数近似原理,首先,设计了一个径向基函数(RBF),其次,在一给定的控制策略下,将最小平方瞬时差分 (LSTD) 法确定函数的权系数与交叉熵(CE)法确定隐层节点基函数的参数相结合,通过在线调整,使Bellman残差平方和性能指标达到最小,最后,根据得到的径向基函数,确定最优策略.通过仿真试验,验证了所设计方法的有效性.
其他文献
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
战术数据链在现代战争中发挥着极其重要的作用.在战术数据链的全寿命周期过程中,建模和仿真为一种重要的支撑技术发挥着越来越重要的作用.主要对战术数据链系统的设计开发、
针对3-RRRT型搬运机器人提出一种解耦的反演自适应动态滑模控制方法,以提高控制精度和鲁棒稳定性.首先利用非线性补偿方法将系统解耦成线性系统,运用一阶动态滑模设计新的滑
设计了一种以 80 97BH单片机为核心的小型电阻炉温度数据采集控制系统。给出了该温度测控系统的基本原理、电路结构和软件的实现过程。 Design a 80 97BH microcontroller a
SOX蛋白具有一个与DNA特异结合的高保守HMG-box结合域.利用MATLAB的Sequence Analysis工具从Genbank 中下载人类SOX蛋白序列信息,二次筛选获得22个有效的序列数据.以三级结构
采用以N-S方程为主控方程的数值模拟方法,进行固定尾翼鸭式气动布局导弹的气动特性和流场数值模拟。系统介绍了文中所用的数值仿真方法。基于气动特性和流场分析研究了固定尾翼鸭式气动布局导弹的流场特性和气动特性,分析结果显示,在尾翼固定的状态下利用鸭舵的差动偏转进行滚转控制效率较低,基于流场仿真结果分析了鸭舵-尾翼间的滚转耦合机理。
简要介绍圆形砼池壁无粘结预应力施工技术 ,介绍了其在施工过程中常见的质量问题 ,提出控制方法和处理措施 ,为无粘结预应力施工质量管理以及工程监理提供有益的借鉴。 This
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
小掠射角声波照射下的掩埋物体散射声场计算,对水声探测系统的设计十分重要.现有基于声线理论的方法,无法计算小掠射角声波照射下的掩埋物体散射声场.基于波数积分声场模型和
提出了同时确定手眼关系以及机器人坐标系到世界坐标系关系的两种算法.和现有算法相比,给出的算法分别基于对偶四元数和矩阵直积理论,均可一次计算出标定方程的旋转部分和平