Distributional Reinforcement Learning with Quantum Neural Networks

来源 :智能控制与自动化(英文) | 被引量 : 0次 | 上传用户:yjj_2323
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Traditional reinforcement learning (RL) uses the return, also known as the expected value of cumulative random rewards, for training an agent to learn an optimal policy. However, recent research indicates that learning the distribution over returns has di
其他文献
In this paper, a user friendly algorithm based on the variational iteration method (VIM) is proposed to solve singular integral equations with generalized Abel
科学技术是第一生产力.从古至今,人们使用的生产工具,掌握的生产技能和劳动生产率所以大不相同,归根结底是由科学技术水平不同决定的.毛泽东的科技思想是他关于中国革命发展
目的观察阴虚胃痛颗粒联合三联疗法治疗阴虚型慢性胃炎的效果。方法2014年1月至2016年12月该院收治的阴虚型慢性胃炎患者180例,随机分为观察组、对照1组、对照2组各60例,对照
羟基脲与马利兰治疗慢性粒细胞性白血病疗效分析林立(广西医科大学第三附属医院南宁530031)羟基脲与马利兰均为临床治疗慢性粒细胞白血病(CML)的主要药物,有必要在严格的分组对照条件下研究
活力源于提高资金使用效益张文友"八五"之初,姜堰市合成纤维厂还是一张白纸。经过五年的精心培育、悉心管理,在主要指标连年翻番之后,今年预计可实现销售4000多万元,利税300多万元,将分别是
介绍平滑定向钻进和基于VLD-1000定向钻机的平滑旋转复合钻进技术关键;利用复合钻进成功钻进一系列超1 746 m长钻孔,其中有6个为超2 000 m长钻孔;复合钻进极大提高了定向钻进
全国乡镇企业财务决算及统计年报会审汇总会议在重庆举行(本刊讯)农业部乡镇企业局1995年度全国乡镇企业财务决算及统计年报会审汇总会议于1996年3月21日至3月29日在重庆召开。部分省、自治区