【摘 要】
:
深度强化学习是人工智能研究中的热点问题,随着研究的深入,其中的短板也逐渐暴露出来,如数据利用率低、泛化能力弱、探索困难、缺乏推理和表征能力等,这些问题极大地制约着深度强化学习方法在现实问题中的应用。知识迁移是解决此问题的非常有效的方法,文中从深度强化学习的视角探讨了如何使用知识迁移加速智能体训练和跨领域迁移过程,对深度强化学习中知识的存在形式及作用方式进行了分析,并按照强化学习的基本构成要素对深度
【基金项目】
:
国家自然科学基金(61806221);
论文部分内容阅读
深度强化学习是人工智能研究中的热点问题,随着研究的深入,其中的短板也逐渐暴露出来,如数据利用率低、泛化能力弱、探索困难、缺乏推理和表征能力等,这些问题极大地制约着深度强化学习方法在现实问题中的应用。知识迁移是解决此问题的非常有效的方法,文中从深度强化学习的视角探讨了如何使用知识迁移加速智能体训练和跨领域迁移过程,对深度强化学习中知识的存在形式及作用方式进行了分析,并按照强化学习的基本构成要素对深度强化学习中的知识迁移方法进行了分类总结,最后总结了目前深度强化学习中的知识迁移在算法、理论和应用方面存在的问题和发展方向。
其他文献
本文从符号价值、教育价值、审美价值三个维度对大型文化类节目《典籍里的中国》的传播价值进行阐释分析,认为该节目跨界混搭的“文化访谈+戏剧+影视化”多媒介表述,让传统典籍与现代生活进行了深度融合,传递出中国精神、中国气派和中国智慧,释放和传承了泱泱大国文化生生不息的厚重传播价值,将大型文化类节目发展推到新的高度。
在添加营养液的蛭石上培育的甜菜种子苗,用1/2MS+0.5mgL-1BAP或1/2B5+0.5mgL-1BAP培养基培养幼苗先端部分,切口处7—10天形成愈伤组织占80%,形成小植株占70%。甜菜叶和叶柄的薄细胞层离体培养,用1/2Ms+0.5mgL-1BAP+0.5mgL-1NAA培养基,愈组率高达80%。
<正>课题选题直接影响着课题研究立项申报、研究实践开展以及高质量研究成果产出。对课题选题的来源及其定题策略进行梳理,既能为幼儿园课题选题提供思考方向,又能为课题定题提供方法。幼儿园教师课题选题的政策来源及其定题策略《浙江省教学成果奖励办法(征求意见稿)》明确了教学成果的申报原则之一即坚持全面贯彻党的教育方针,《浙江省教育科学规划课题管理办法(修订版)》第二条明确规定浙江省教育科学规划课题必须坚持把
石灰土作为路基填料代替宕渣是一种较为经济的方案,但灰土初始强度低、硬化速率慢、碳化时间长,不利于快速施工,需要进行改良研究。利用偏高岭土与石灰发生火山灰反应的原理改良灰土,通过单轴压缩试验和三轴压缩试验,分析改良灰土冻融循环条件下力学参数变化规律,利用图像处理技术提取改良灰土图像表面孔隙,建立孔隙率与强度的关系,并通过研究龄期、石灰含量和含水率变化规律,分析偏高岭土改良灰土的机制。结果表明:偏高岭
<正>中国人民大学劳动人事学院教授、中国就业研究所所长曾湘泉预计,2023年的大学生就业压力可能会有所缓解,但青年失业率仍将处于高位。随着疫情防控政策的放松放开,经济逐步恢复将对供需两端产生积极影响,周期性失业将有所降低。
为了让古诗词教学更符合课程改革的要求,教师要创新古诗词教学,合理应用新的观念和方式帮助学生感受古诗词的美感,从多层次、多方面引领学生赏析、品读古诗词,让学生感受到古诗词的独特魅力,激发学生的学习兴趣,让他们喜欢学习古诗词,发扬与传承国学文化。
大数据时代背景下,互联网技术发展迅速,Java EE作为互联网时代中一种最为先进的直接面向对象计算机软件设计与开发的技术,在实际软件开发、设计过程中采用了多种软件设计技术,最终实现的Java EE计算机软件设计与开发项目重点采用了开发框架,其中通过构建多种技术组件,用以实现更为精简化的现代化软件开发部署新环境。
神经网络模型性能日益强大,被广泛应用于解决各类计算机相关任务,并表现出非常优秀的能力,但人类对神经网络模型的运行机制却并不完全理解.针对神经网络可解释性的研究进行了梳理和汇总,就模型可解释性研究的定义、必要性、分类、评估等方面进行了详细的讨论.从解释算法的关注点出发,提出一种神经网络可解释算法的新型分类方法,为理解神经网络提供一个全新的视角.根据提出的新型分类方法对当前卷积神经网络的可解释方法进行