报酬函数相关硕士博士期刊学术论文

报酬函数相关论文

基于逆向强化学习的报酬函数构建

近几年来,强化学习和学徒学习作为机器学习的两个子领域得到了极大的发展。在目前的强化学习技术中,报酬函数的自动构建是迫切需要......

学位

逆向强化学习报酬函数马尔可夫决策环境模型

基于“囚徒困境博弈”的企业行为分析

本文鉴于市场上同一行业内部囚徒困境博弈的广泛存在,采用博弈论的分析工具来剖析同一行业内的企业行为,主要关注企业背叛行为并证......

期刊

囚徒困境博弈行为分析超博弈支付矩阵均衡结果均衡点报酬函数博弈论模型行为模式约束机制

电梯群控动态配置的强化学习简化算法

根据马尔科夫决策过程和Q-learning算法,通过简化处理求解电梯群控系统在上行峰值期间的最优配置问题.给出电梯群控系统最优配梯的......

期刊

马尔科夫决策过程强化学习报酬函数可能停站数

基于部分可观测随机过程的最优停时问题

研究基于部分可观测随机过程的最优停时问题，且此部分可观测随机过程可由Kalman-Bucy滤波方法进行估计。而最优停时问题的报酬函数......

学位

部分可观测随机过程最优停时问题 Kalman-Bucy滤波报酬函数

由公司治理指数看经理层激励约束机制的改进

通过分析南开大学公司治理研究中心公开的中国公司治理指数数据，得出了几个结论：经理层治理水平连续三年不断提高；任免制度和执行保障......

期刊

经理层治理评价指数激励约束机制报酬函数改进 top managers＇ governance index incentive and restricti

一种最优规划程序设计语言OPPLFC

提出了一种基于流演算的最优规划程序设计语言OPPLFC(optimal planning programming language basedon fluent calculus)。通过定......

期刊

流演算流演算执行器报酬函数最优规划算子程序设计语言 fluent calculus FLUX reward function the optima

休假机制超市模型的报酬过程

超市模型已经成为解决大型网络资源管理问题的一个重要的数学工具,它具有操作简单、运行方便的特点,能对大型的网络资源进行实时控......

期刊

超市模型实时控制报酬函数性能优化

由上市公司治理指数看经理层激励约束机制的改进

通过分析南开大学公司治理研究中心公开的中国公司治理指数数据，得出结论：经理层治理水平连续三年不断提高；任免制度和执行保障的发展......

期刊

经理层治理评价指数激励约束机制报酬函数改进 top managers＇ governance index incentive and restricti

投资组合绩效评价中的条件性方法与基准选择

...

期刊

绩效评价条件性投资策略市场指数模型解释有效前沿 CAPM 单位风险风险厌恶报酬函数

契约理论在会计领域研究的现状及启示——Richard A.Lambert《契约理论与会计》赏析

<正>《契约理论与会计》(Contracting Theory and Accounting,以下简称《综述》)是Richard A.Lambert教授于2001年发表在《会计学......

期刊

代理人期望效用会计领域《契约理论与会计》 Richard A.Lambert 契约理论业绩指标委托人报酬函数

一类具有马尔科夫性的跨期重复选择问题的研究

决策就是从一个备选方案集中选择出若干个个体或群体偏好的方案。当面对复杂的决策问题时,单个决策者仅凭自身的经验和智慧往往难......

学位

群决策跨期重复选择马尔科夫决策规划报酬函数 Condorcet循环

基于性能灵敏度的逆向强化学习

逆向强化学习是指通过专家行为获取潜在报酬函数的过程,进而可利用强化学习等优化理论得到最优的控制策略,因而可以实现对专家行为......

会议

性能灵敏度逆向强化学习报酬函数

基于逆向强化学习的自主驾驶技术研究

随着机器学习算法的发展,自主驾驶技术不断向前推进,将对未来的城市交通产生重要影响。自主驾驶任务的核心在于决策与控制算法,传......

学位

逆向强化学习自主驾驶专家演示数据专家监督损失报酬函数

基于小世界网络模型的知识密集型服务业集群的知识传播分析

知识密集型服务业集群和其它网络一样,也具有典型的小世界网络特征。在对知识密集型服务业集群的基本内涵和小世界网络应用现状分......

期刊

知识密集型服务业集群小世界网络平均路径长度聚集系数报酬函数

“三角债”的博奕理论分析

<正> 一引言 “三角债”是人们对企业之间超过托收承付期或约定付款期应当付而未付的拖欠货款的俗称。90年代初,它突然成为中国、......

期刊

债务链报酬函数博奕理论债务规模商业信用债权额机会成本

基于公司治理指数的经理层激励机制分析

针对我国上市公司激励约束机制的发展明显滞后于经理层治理的发展问题,利用历史方法,分析了现有激励约束机制——年薪制、持股制和......

期刊

经理层治理评价指数激励约束机制报酬函数

看过本文同时还关注