基于生成对抗模仿学习的人机辅助决策系统

来源 :微型电脑应用 | 被引量 : 0次 | 上传用户：climb_climb

【摘要】

：

在核电人机界面操作环境中,主要依赖专家操作.将专家在人机界面上的操作过程看作马尔可夫决策过程,针对操作过程经验难以准确描述以及奖励函数难以确定的特点,提出了利用模仿

【作者】

：

杨高光

【机构】

：

上海交通大学电子信息与电气工程学院,上海200240

【出处】

：

微型电脑应用

【发表日期】

：

2021年3期

【关键词】

：

人机界面专家操作生成对抗模仿学习决策支持系统

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

在核电人机界面操作环境中,主要依赖专家操作.将专家在人机界面上的操作过程看作马尔可夫决策过程,针对操作过程经验难以准确描述以及奖励函数难以确定的特点,提出了利用模仿学习方法学习专家操作构建辅助决策系统.从而利用模仿学得的专家策略来为界面操作提供参考,以降低人为因素失误发生概率.用神经网络生成专家策略,以专家策略和生成策略之间的信息熵为损失函数来解决神经网络的收敛问题.最后,在Mujoco仿真环境中验证了该方法的可行性.

其他文献

基于计算机系统的集体企业施工类行业项目管理系统研究

不断提升的企业信息化建设水平为企业提供了便捷服务,同时也对计算机信息系统在项目集成管理中的应用提出了更高的要求,在分析了工程建设项目管理信息系统集成基本含义的基

期刊

计算机信息系统集成工程建设项目管理管理信息系统集成模式

基于信息感知的智能环网柜系统集成与应用

设计了一种基于Zigbee通信的无线测温与电压监测一体、内窥式超声波与暂态地电压局部放电传感器,集成开发一套无线测温与局部放电在线监测一体的智能环网柜,并通过试验及现场

期刊

智能环网柜无线测温传感器电压传感器局部放电传感器状态信息感知集成与应用

章含之的晚年岁月

一　　1990年章含之随国务院农村发展研究中心并入国务院发展研究中心（以下简称中心），先后任办公厅副主任，分管外事处（对外称外事办公室，1994年更名为国际合作部，章先后任副主任、负责人）。1992年我调任办公厅主任，与童含之开始有了较多的接触和联系。　　章含之对工作尽职尽责，非常认真，甚至到了近乎苛刻的地步。记得.1993年国务院发展研究中心与云南省政府联合组织一次大型国际会议，我和章含之带一个

期刊

章含国际合作部办公厅副主任外事办公室外事处乔冠华农业政策外事活动外事工作钓鱼台国宾馆

新能源汽车制动防抱死系统研究与优化

针对新能源汽车防抱死问题,采用PID控制算法和模糊控制对以滑移率为基础的防抱死制动控制器设计方案进行构建,通过所构建的路面识别系统,实现了行驶于不同路面上的汽车对最佳

期刊

新能源汽车防抱死制动系统模糊PID控制算法路面识别最佳滑移率

基于神经网络的P2P流量识别方法

研究P2P流量的识别对于P2P网络的管理具有十分重要的意义,针对当前P2P流量的识别方法存在的误差大,识别结果不稳定等缺陷,为了改善P2P流量的识别效果,提出神经网络的P2P流量

期刊

P2P网络流量数据集神经网络预处理识别实验

汽车电子机械式制动系统研究

采用CAN总线完成了一种模块化制动系统设计方案的构建,该系统的主控制处理器选用了 ARM芯片,负责接收总线控制信号的从处理器选用了 AT89C51.主从节点间通过CAN总线实现数据

期刊

电子机械制动系统CAN总线ARM芯片AT89C51实现路径

基于生成对抗模仿学习的人机辅助决策系统

与本文相关的学术论文