加强学习

来源 :计算机科学 | 被引量 : 0次 | 上传用户:wcfsoa2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
加强学习(Reinforcement Learning,简称RL)是一种重要的机器学习方法,在机器入规划、分析预测等领域有许多应用。加强学习的任务即是寻找一条策略,为行为者(agent)在一给定状况下产生一个动 Reinforcement Learning (RL) is an important machine learning method and has many applications in machine planning, analysis and prediction. The task of strengthening learning is to find a strategy for the agent to produce a move in a given situation
其他文献
目的:  通过流行病学调查方法了解口腔黏膜病患者口腔卫生及牙周健康状况,为口腔黏膜病患者牙周病的预防与治疗提供依据。  方法:  对中国医科大学附属盛京医院口腔科门诊
目的:探讨超声在甲状腺乳头状癌与结节性甲状腺肿中的鉴别诊断价值,利于早期诊断疾病给予治疗。方法:选取2015年6月至2016年6月我院收治的甲状腺结节患者84例,根据临床病理诊
在分析神经计算中已有的满意度运算的基础上,找出其中存在的问题,提出了与阈值有关的整体满意度,并对其进行了分析比较。结果表明:整体满意度综合了组合满意度和平均满意度的优点
派诺特是首批(即便不是第一个)开辟消费级无人机市场的公司之一.派诺特2010年推出AR Drone,几年之后,又跟着推出了升级版的AR Drone 2.0.此后,我们见识到了派诺特的Bebop,还
期刊
需要记住的是,这一切都发生在勇士队面对未来的一个奇怪的十字路口上--球队主席罗伯特·罗威尔刚刚把克里斯·穆林踢出了决策层;老尼尔森想要尽量巩固自己手中的权力;时任总经理
期刊
迪万塔·波拉德的母亲是他最好的朋友,也是他最好的教练。如今,她因为绑架罪而入狱,而迪万塔是指证她有罪的证人之一。作为前最佳新人的迪万塔已经转入了休斯敦大学,在没有母亲的
期刊
目的:Ⅰ型胶原广泛存在于牙周组织中,牙周病变会导致牙周组织破坏,Ⅰ型胶原降解。Ⅰ型胶原交联氨基末端肽(cross-linked N-telopeptides oftypeⅠ collagen,NTX)是Ⅰ型胶原降
学位
新闻标题在新闻中的重要性无须赘言,但而今标题的谬误却频频呈现在报纸上,对读者阅读新闻非但不能起到“眼睛”、“索引”、“窗口”、“广告”和“题好一半文”的作用,反而
目的:对比远端胃切除术与全胃切除术对远端胃癌患者术后并发症及预后的影响。方法:选取在我院就诊的远端胃癌患者40例,按随机数表法分为两组,各20例。对照组行全胃切除术,观
目的:应用三维有限元法建立下颌第一磨牙纵折模型,对该模型模拟施加载荷,对磨牙纵折模型各部分进行生物力学分析,并与正常磨牙牙体进行对照分析,从生物力学角度对纵折牙的保