论文部分内容阅读
车辆驻站是提高常规公交服务可靠性的常用且有效控制策略,其执行过程需要在随机交互的系统环境中进行动态决策。本文考虑实时公交运营信息的可获得性,以马尔可夫决策过程为理论基础,建立了常规公交驻站控制的多智能体马尔可夫决策模型。模型从多智能体、状态、动作、状态转移函数、收益五方面描述了单线公交服务系统驻站控制结构;从全局优化的角度,以乘客车上和在站候车总成本最小化为优化目标,采用改进策略迭代算法寻求有限阶段车辆驻站控制的最优策略。数值仿真验证了模型和算法的有效性。