基于机器强化学习与蒙特卡洛树的基本原理及其应用

来源 :通讯世界 | 被引量 : 0次 | 上传用户:liongliong438
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
强化学习(Reinforcement Learning RL),又称增强学习,是一种重要的机器学习方法,它不像监督学习需要先验知识,而是通过不断与环境交互来获得知识,自主地进行动作选择。本文通过对强化学习和蒙特卡洛方法的基本原理的介绍,系统地探讨了其在金融投资、机器人控制、医疗等方面的应用。对强化学习的应用推广有创新性启发。
其他文献
对于公共卫生工作来说,畜牧兽医动物防疫工作是比较重要的,会直接影响到经济的发展和畜牧业产业结构的发展,属于畜牧业发展的基础工作,其中做好畜牧兽医动物防疫工作能够附近
根据CAE技术网络化与协同化的发展趋势,描述了协同CAE的基本概念和技术目标,提出了CAE协同的三个协同策略,分别是分析任务间的协同、前处理过程协同、CAE与CAD设计流程的协同。基于这三种协同策略,首次创建了协同CAE的层次结构系统模型。为了实现这一系统模型,研究了系统的技术结构方案,并对协同分析方案规划以及基于PDM的协同过程管理两项关键技术进行详细描述,通过CAE技术与各项协同过程管理技术的
在本文中,主要介绍了直流系统接地概念、原因、种类、危害及故障监测方法,并综合比较发电厂和变电站中常用的绝缘监察的方法,提出了一种新方法,进行了详细推导,并将其应用到
运用车辆-轨道耦合动力学理论,建立三大件式转向架货车与轨道结构耦合动力学模型,详细考虑货车系统非线性特性,包括轮轨接触非线性、轴箱间隙非线性、楔块干摩擦非线性及转向