加强学习中决策准则的选择

来源 :第六届全国机器学习研讨会 | 被引量 : 0次 | 上传用户:darksmile11
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文讨论目前一种比较活跃的机器学习方法--加强学习,它在机器人规划领域有重要应用。首先指出在加强学习模型中单一的期望值准则或极小极大准则均不总是可靠的,然后提出一种决策准则的选择方法。该方法考虑了行为者是基于长期运行还是基于短期运行,实例分析表明该方法是实用的、合理的。
其他文献
我国的科技水平不断发展,相应地也推进了我国的教育事业的进步.就目前高校课程教学实际来看,新媒体应用已经逐渐推广.教师应该意识到思想政治教育引导现阶段不能单纯地依靠理
目前的高校教育更为注重大学生综合素质的培养,对大学生开展思想政治教育是主要的培养途径.要使大学生思想政治教育获得良好的教育效果,就要注重采用“人文关怀”和“心理疏
会议
从2012年年底到2013年年初,全国多个城市传来了楼市“开门红”的消息,而伴随相关数据的唱和,楼市暴涨言论也再次泛起。  令人怀疑的数据  上海易居房地产研究院发布数据显示:2012年12月,房企年末推盘冲量,20个城市成交量同比增长90.3%、环比增长12.4%。另据中指院数据显示:2013年第一周楼市成交很旺,在检测的40个城市中,成交同比上涨的城市占9成以上,其中广东韶关增幅竟达681.3