基于生成对抗模仿学习的人机辅助决策系统

来源 :微型电脑应用 | 被引量 : 0次 | 上传用户:climb_climb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在核电人机界面操作环境中,主要依赖专家操作.将专家在人机界面上的操作过程看作马尔可夫决策过程,针对操作过程经验难以准确描述以及奖励函数难以确定的特点,提出了利用模仿学习方法学习专家操作构建辅助决策系统.从而利用模仿学得的专家策略来为界面操作提供参考,以降低人为因素失误发生概率.用神经网络生成专家策略,以专家策略和生成策略之间的信息熵为损失函数来解决神经网络的收敛问题.最后,在Mujoco仿真环境中验证了该方法的可行性.
其他文献
不断提升的企业信息化建设水平为企业提供了便捷服务,同时也对计算机信息系统在项 目集成管理中的应用提出了更高的要求,在分析了工程建设项目管理信息系统集成基本含义的基
设计了一种基于Zigbee通信的无线测温与电压监测一体、内窥式超声波与暂态地电压局部放电传感器,集成开发一套无线测温与局部放电在线监测一体的智能环网柜,并通过试验及现场
一  1990年章含之随国务院农村发展研究中心并入国务院发展研究中心(以下简称中心),先后任办公厅副主任,分管外事处(对外称外事办公室,1994年更名为国际合作部,章先后任副主任、负责人)。1992年我调任办公厅主任,与童含之开始有了较多的接触和联系。  章含之对工作尽职尽责,非常认真,甚至到了近乎苛刻的地步。记得.1993年国务院发展研究中心与云南省政府联合组织一次大型国际会议,我和章含之带一个
针对新能源汽车防抱死问题,采用PID控制算法和模糊控制对以滑移率为基础的防抱死制动控制器设计方案进行构建,通过所构建的路面识别系统,实现了行驶于不同路面上的汽车对最佳
研究P2P流量的识别对于P2P网络的管理具有十分重要的意义,针对当前P2P流量的识别方法存在的误差大,识别结果不稳定等缺陷,为了改善P2P流量的识别效果,提出神经网络的P2P流量
采用CAN总线完成了一种模块化制动系统设计方案的构建,该系统的主控制处理器选用了 ARM芯片,负责接收总线控制信号的从处理器选用了 AT89C51.主从节点间通过CAN总线实现数据