基于强化学习的车辆路径诱导算法研究

来源 :浙江师范大学 | 被引量 : 0次 | 上传用户:FSACN
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会经济的快速发展和机动车保有量的持续增长,以交通拥堵为代表的城市交通问题日趋严重。动态路径诱导作为智能交通系统的重要组成部分,是平衡路网交通流量分布、缓解交通拥堵的有效途径。本文利用强化学习技术的Q-learning算法研究了分布式路径诱导算法和中心式路径诱导算法,主要研究工作如下:(1)提出了一种基于模拟退火策略的Q-learning分布式路径诱导算法。首先,设计了平衡最短路径长度与最大路径行程时间可靠度两个优化目标的奖励函数;其次,采用模拟退火策略作为动作选择策略平衡探索与利用的关系,完成路径诱导任务;然后,设计了值参照值,从收敛后的表中选取次优路径;最后,根据实际路网数据通过仿真实验验证了本算法的收敛性能和路径规划结果。实验结果表明,该算法在兼顾路径长度和路径行程时间可靠度方面具有良好的性能表现,并能提供次优路径作为备选,且收敛时间比采用贪婪策略降低了57.57%。(2)提出了一种基于Q-learning的中心式动态路径诱导算法。首先,利用基于值的动态路径规划算法处理路网历史数据,赋予表初始值;然后,以车辆通过路段的行程时间作为奖励,设计了基于7)8)(69)9)概率分布的自适应动作选择策略,根据整体路网交通状况和局部交通状况为群体车辆协同分配路径,采用Q-learning算法中状态动作值函数更新规则更新表;最后,基于元胞自动机模型构建了一个类曼哈顿型路网来验证本算法的效果。从交通系统的平均流量、平均车速、平均旅行时间、平均到达率和车辆分布情况五个方面与动态更新的4)5)6)(6算法进行对比分析,最大平均流量增幅达到7.94%,最大平均到达率增幅达到6.90%,同时在一定程度上提高了系统平均车速,降低了系统平均旅行时间,使交通流分布更加均衡,能有效缓解城市中心区域交通压力。
其他文献
投资者保护措施对促进资本市场发展乃至国家经济总体发展情况而言的重要性已成为基本共识。近年来,在构建资本市场高质量发展新格局关键时期,投资者保护越来越得到重视。投资者保护的改善究竟会带来哪些好处,投资者保护如何与资本市场建立联系,这些问题尚待研究。目前对于投资者保护的文献多集中于公司金融领域。少数文献尝试从资产定价领域进行研究,但以理论研究为主,实证文献较少。在前人研究基础上,本文尝试填补投资者保护
学位
保费继续率是一个寿险公司的核心业务品质指标,它用于衡量一段时间后寿险保单对应的保费继续有效的比率。继续率的高低,直接影响着公司利润及价值的实现。近些年来,套利风险、退保黑产等问题的不断出现,对整个行业的保费继续率都造成了负面影响。针对该问题,本文将树方法及其集成算法等机器学习算法引入寿险领域,建立保费继续率预测模型,从传统的事后经验分析走向事前的预测与建议,可以为保险公司的经营管理提供及时预警。一
学位
2021年底,我国第二代偿付能力监管体系二期工程顺利建成,保险业自2022年第一季度开始全面执行新规。近年来,随着我国经济形势以及保险公司业务模式、风险特征的不断改变,传统保险公司风险管理体系需要进一步改革优化。经济资本模型能够根据保险公司自身经营环境和风险状况,建立以风险为导向的风险管理系统。在保险损失存在非对称性和尾部相关性的实际情况下,考虑相依风险的经济资本配置模型能够精准刻画保险风险的复杂
学位
有效市场理论是经典金融学的基石,但大量实证研究显示,金融市场收益率时间序列具有尖峰、厚尾、有偏、长记忆性等非正态特征,不符合有效市场假说。Peters(1991)提出分形市场假说,核心参数Hurst指数()表示时间序列的分形特征:若=1/2,序列随机且不相关,对应经典理论的布朗运动;若∈(0,1/2),序列会频繁出现趋势反转,即具有均值回复性;若∈(1/2,1),序列具有趋势持续性,即长记忆性。大
学位
持久性有机污染物多溴代联苯醚(hydroxylated polybrominated diphenyl ethers,PBDEs)已经在多种环境介质及人体和动物体内广泛检出,对人和野生动物有神经发育毒性,其羟基化衍生物(HO-PBDEs)还具有内分泌干扰效应,严重危害生态环境安全和人类健康。已有研究表明:HO-PBDEs具有显著的甲状腺激素(thyroid hormones,THs)干扰效应,可与
学位
国家最新统计数据显示,截至2021年底,我国65岁及以上老人占比14.2%,我国已提前进入“深度老龄化社会”,老年群体的健康保障成为当前社会面临的很大问题。在我国政府老年医疗及健康管理负担大、医疗费用支出负担增加的背景下,作为老年健康风险有力保障的商业健康保险发挥着日益重要的作用。如何开发更适合老年人的健康保险、解决老年人群的健康保障问题,是保险行业一直思考的问题和探索的方向。2013年,我国推出
学位
自然景物的模拟在影视动画、游戏、虚拟现实、广告等领域应用非常广泛。尤其随着4K显示屏的普及,如何用计算机图形技术生成细节丰富且又具有真实感的画面成为了新的研究热点和难点。喷泉场景在自然场景中应用广泛,具有重要的实用价值。喷泉水珠粒子的运动具有动态性和规律性,但在风力的作用下水珠的运动会更加复杂。本文以模拟风场下的具有真实感的喷泉以及波光粼粼的喷泉水波为研究目标,对虚拟风场以及喷泉和水波的关键技术进
学位
大流行病具有高度的传染性和广泛的地理分布,极易给社会带来巨大的损失。商业保险公司对大流行病风险的承受能力有限,政府仍然需要充当最大救济者,有效运用财政手段防治疫情。然而,政府在也可能存在资源短缺,不仅会造成财政赤字,还影响疫情防控的效率。对此,美、欧、日等发达经济体及世界银行等金融机构纷纷将目光转向资金雄厚的资本市场,利用巨灾债券等巨灾风险证券化的方式得到资金方面的支持。我国具备发行流行病巨灾债券
学位
保险公司必须要满足监管的偿付能力要求。然而,如果规定保险公司只能使用监管标准模型计算资本需求,当风险来临时,保险公司的策略可能会有一定的趋同性,会很大程度上影响经济波动;同时,监管的标准模型有一定的不合理性,它忽略了可能存在的模型缺陷和参数误设问题。因此,内部模型的提出有利于防控系统性风险,弥补标准方法的缺陷。本文首先介绍了三种主要的偿付能力监管规定,然后介绍了本文使用的内部模型,从不同于监管角度
学位
在大数据时代下,越来越多的数据被捕获,许多新兴数据源(文本数据、图像数据、传感器数据)的出现为公司的分析与利用提供了更广阔的维度。对于保险精算行业来说,数据占据着至关重要的地位,对于数据的分析与使用可以使公司拥有竞争优势,这些新兴数据源可以补充传统数据,从而提供更好的洞察与视野,以实现更精准的预测。但是对于大多数传统的精算模型来说,主要使用结构化的向量数据作为输入,并不能很好地支持这些新兴数据源的
学位