基于深度强化学习的车辆资源调度与交易算法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:wplyaq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,共享乘车市场迅速发展,其在城市交通资源配置和推动共享、低碳经济发展等方面发挥着不可忽视的重要作用,与之相关的车辆资源调度优化问题和动态定价优化问题引起了工业界和学术界的广泛关注。随着人工智能(Artificial Intelligence,AI)技术发展与应用,一批利用深度强化学习技术解决车辆资源调度问题的方法被提出,这些方法通过优化车辆资源在空间维度的分布以平衡供需关系。然而,从用户需求的角度来看,用户出行需求既在空间维度动态变化,又在时间维度上下起伏。从车辆资源的角度来看,车辆资源总量随时间动态变化,但共享乘车系统仍缺乏高效的管理机制来优化车辆资源在时间维度的分布。因此,本文基于深度强化学习技术,提出了具有自适应奖励机制和多目标优化的巡航车辆调度与车辆资源管理方法。该方法的短期目标是基于车辆资源供需关系和时间、地理位置等上下文信息,预先调度巡航车辆去往重负载的热点区域,以平衡空间维度的供需差异;该方法的长期目标是基于请求成功率和巡航车辆匹配成功率,自适应调控系统中车辆资源总量,以平衡时间维度的供需差异。仿真实验的结果表明,该方法有效改善了运营商收益,均衡了请求成功率和车辆利用率,同时,缩短了共享出租车空跑时长和用户等待时长。共享乘车市场发展至今,渐成多运营商竞争共存之局,但多运营商场景下车辆资源交易和动态定价策略的研究仍在发展初期。因此,为了应对运营商数量增多和用户选择自由度扩大带来的供需关系复杂化和市场竞争加剧等挑战,有必要建立良好的市场机制来解决用户与多运营商之间的供需关系以及各运营商之间的竞争关系,从而推动共享乘车市场持续健康的发展。因此,本文基于区块链技术设计了多运营商场景下的车辆资源交易市场框架。基于非合作博弈理论,本文将多运营商与用户的车辆资源交易建模为两阶段的斯塔克尔伯格博弈,并且,本文基于多智能体强化学习,实现了竞争定价的智能体,智能体基于车辆资源供需关系和市场竞争关系等因素进行动态定价。实验结果表明,本文所提的动态定价方法能够有效改善运营商的收益,进而,激励运营商参与市场框架下的车辆资源交易。此外,竞争定价智能体在提高运营商的收益的同时,一定程度上改善了用户利益,进而,改善了用户体验和运营商的市场吸引力。
其他文献
<正>自中共中央、国务院印发《关于全面加强新时代大中小学劳动教育的意见》以来,学校及整个社会对劳动教育的重视程度有了明显的提高。同时,教育内容及形式的多样化也为劳动教育的有效开展创造了良好条件。但有一个现象值得反思:如果学生每参加一次劳动活动,都要拍照打卡,还要将打卡留痕上传相关微信群进行材料汇总,劳动教育能起到真正的效果吗?这样繁复的拍照打卡程序会不会影响学生对劳动的态度?
期刊
开发区改革是我国在改革开放进程中的一次伟大尝试,在当时的社会发展背景下,显著的改善了国内的投资环境,对体制机制的变革做出有力促进作用,实现了产业的聚合效应,对区域社会经济发展发挥了极大的作用,是我国在工业化和城镇化发展路线上的一座丰碑。2017年1月出台的《关于促进开发区改革和创新发展的若干意见》中,国家对开发区改革做出了进一步的指导意见,也标志着开发区体制机制改革新阶段的开始。Q开发区紧随此次意
帮助政府更好的履行公共受托责任,是政府会计要达到的最高层次会计目标。近年来,伴随着我国对政府职能开始进行转变,政府不断开展和深化针对财政体制的改革,公众对于政府公共受托责任的履行效果给予了更高的期望,公众关注的焦点和其内涵也都不断在发生变化。在这种背景下,为实现对国家治理体系以及治理能力现代化的不断推进,提升政府会计制度科学化、促进政府会计管理法制化、推动政府会计信息公开化,自2019年1月1日起
为了研究学生在物理模型建构过程中定性和定量思维发展情况,结合课程标准要求和专家研究基础,从课堂的温度和有效程度出发,以高中物理牛顿第二定律的应用等时圆模型建构教学为例,记录学生在等时圆模型建构过程中定性思维和定量思维层层递进地发展过程,并对其相关特点进行研究。在研究中总结出几种培养学生定性和定量思维的方法策略,促进学生课堂学习效率的提高和学生素养水平的提升。
农村初中英语教学大多采用集中授课的方式,但是这种方式很容易忽视班级学生的个体差异,这就造成学生成绩两极分化问题越来越突出。在新课改背景下,农村初中英语教师应根据学生英语学习的具体情况,分层开展教学,不断探索新的教学方式。本文立足于农村初中英语教学现状以及英语学科核心素养的内涵、探讨了农村初中英语分层教学的意义,在核心素养导向下探讨了农村初中英语分层教学策略,希望能促进农村初中英语教学质量的提升。
<正> 当前,我国经济发展和国企改革已进入了关键时期,党的十五大明确提出了这一时期经济工作的主要任务是实现“三年两大目标”,即:“用三年左右的时间,使大多数国有大中型骨干企业初步建立现代企业制度,使大多数国有大中型亏损企业走出困境”。全面完成这项任务.对促进社会经济的持续、快速、健康发展,维护国家安定团结的政治局面,保证下世纪宏伟蓝图的顺利实现,具有重大而深远的意义。对于国有大中型工业企业占经济主
期刊
随着机器人领域相关技术日趋成熟,移动机器人如今已经应用到各个行业,如工业、国防、教育、太空和家庭等领域。由于机器人所处环境的复杂性和动态障碍物的不确定性,机器人能否在环境中快速的找到一条安全的最优路径问题成为机器人领域的重点研究问题。本文主要对静态环境和动态环境下的机器人路径规划算法进行研究,并搭建了基于机器人操作系统(Robot Operating System,ROS)开发平台的四驱移动机器人
随着新课改的深入,对于学生核心素养的培育受到各方的重视。在这样的背景下,初中英语教师要转变原有的课堂教学理念,积极运用先进的分层教学方式,将培育初中阶段学生的英语核心素养作为教学活动的核心目标。基于此,本文就核心素养视域下初中英语分层教学展开探究,以期为相关教师提供一定帮助。
本文研究如何在城镇化背景下优化农村小学的教育资源配置问题。目前,城镇化的加速发展使教育资源偏向城镇,这种不均衡对农村小学的教育造成了较大的影响。农村小学作为我国义务教育的重要组成部分,对其资源配置的研究有利于改善目前农村小学教育现状,能够提升农村地区义务教育水平,有利于促进城乡教育之间的公平发展。本文认为农村小学教育资源主要包括师资力量、教学设施、教育经费、招生资源四个维度;教育资源配置主体为宏观