基于强化学习的指路标志指引路径优化研究

来源 :北方工业大学 | 被引量 : 0次 | 上传用户:xiaodong618
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
指路标志作为重要的交通控制设施,担负着向驾驶员传递道路信息的作用,是城市交通系统中必不可少的一部分。为了完善现有的指路标志指引路径规划方法,本文结合指路标志的信息过载问题和指引路径规划问题展开研究。指路标志指引路径规划的目的是满足驾驶员出行需求和降低指路标志的管理成本,因此综合考虑驾驶员出行成本及指路标志布设成本构建目标函数。通过归一化处理影响驾驶员在指引路径的起讫点间出行的因素,利用路径长度、道路交通流量、车辆转向次数三个变量定义驾驶员出行成本。指路标志布设成本则与指引路径上的指路标志数量相关。之后,结合两类指引路径成本得到目标函数。建立模型的目标函数后,基于A*算法构建指引路径规划模型。由于在构建指引路径规划模型过程中,尚未考虑驾驶员在实际驾驶过程中对指路标志的视认过程,可能导致指引路径规划结果有失偏颇,使交通节点上的指路标志产生信息量过载的问题。因此,为了改善指引路径规划模型的实用性,基于E-prime软件展开静态视认实验,分析不同场景下指路标志版面信息量大小与视认时间的量化关系,并据此设计惩罚函数。在模型的目标函数中加入惩罚函数后,当算法搜索到的某一节点的指路标志信息量超过设定阈值时,即给当前的指引路径成本一个合理的惩罚值,能够使模型客观地判断是否需要避开对该节点的搜索。考虑到实际路网中存在对多个起讫点间进行指引路径规划的需求,也为了提升本文模型的应用价值,基于强化学习中的Deep Q-learning Network(DQN)算法对指引路径规划模型进行改进,得到多指引路径规划模型。该模型能够解决单起点至多兴趣点(Points of Interest,POI)、多起点至单兴趣点两种场景下的多指引路径规划问题。最后,通过基于微观仿真平台的应用实例对比指引路径规划模型和多指引路径规划模型得到的指引路径规划方案的优劣,发现后者在对这两种场景下的指引路径进行规划时,得到的方案具备更低的总成本。
其他文献
网络化控制系统是将控制器、执行器与传感器通过通信网络连接起来的一种分布式控制系统,具有远程和大范围控制、便于安装和维护、移动性强等优点。由于通信网络特别是无线网络的开放性和保护不足,通过网络传输的数据很容易被窃取,甚至遭到恶意攻击者的破坏。因此,本文从控制安全的角度研究了网络化控制系统中虚假数据注入攻击的设计、检测和分析问题,主要研究工作如下:(1)针对网络化控制系统反馈通道测量数据和前向通道控制
图像分类旨在判断输入图像所属类别,是计算机视觉四大基本任务之一,单分类(one-class classification)是针对数据集中只包含一种类别样本的分类问题,在实际场景中的应用十分广泛。近年来随着深度学习理论的发展,许多优秀的分类网络被提出用来解决单类分类问题。但在实际应用中,分类器的分类效果常常会受到复杂背景、数据样本集小、目标在图像中的占比小等诸多因素影响,效果还不是很理想,基于深度学
网络购物时代的来临,使得物流运输业变得日益重要,日常小件货物的分拣、存放、运输等问题也越来越突出,其中必然会涉及物体的重量和尺寸信息。尺寸信息也就是物体的体积。如何智能化、自动化地获取物体的体积信息是亟待解决的问题。而已有的视觉测量技术,大多需要人工进行物体的定位检测、识别以及角点、边缘线等的提取,考虑到近年来深度学习理论在物体识别等方面的成功应用,本文以此为研究背景,系统探讨了在深度学习框架下利
目标跟踪广泛应用于智能家居、医学诊断、交通视频监管等多个领域。随着相关滤波、深度学习的理论知识和计算机存储设备的迅速发展,判别式跟踪算法逐渐成为目标跟踪领域的主要发展趋势。判别式跟踪算法将目标跟踪问题转变成跟踪的目标与背景之间的二分类问题。因此算法先利用正负样本训练前景与背景的分类器,然后用该分类器在后续帧中找到最优目标区域。判别式跟踪算法的核心是目标定位、尺度以及速度三个问题,本文在判别预测模型
为了满足人们的精神文化需要,尤其是影音娱乐方面,超高清技术正处于大力发展阶段。但由于成像硬件设备的价格高昂,靠提升硬件来提高清晰度显然是无法大面积实行的。随着近些年深度学习的发展,依靠神经网络来进行超分辨率重构已经如火如荼,其不光成本低廉、便于部署,且重构效果已经超越了很多传统算法。超分辨率,其目标是从低分辨率图像中尽可能的恢复更多的细节信息,使图像变得更清晰,更容易被人眼所接受。针对单帧图像超分
随着大数据时代的到来,计算机与移动网络的飞速发展。我们已经迎来了5G网络,人们获取信息的途径越来越多,每天数以亿计的信息留存于互联网上。丰富的信息资源在互联网上构建了一个大型知识库满足人们对未知信息的渴望。但是,庞大的信息量也让人们很难快速得到有价值的信息,如何快速筛选有价值的信息是当前亟待解决的难题。自动问答系统可以根据用户所提出的问题,自动挖掘问题的语义信息,并快速匹配得到问题的正确答案反馈给
地基合成孔径雷达(Ground-based Synthetic Aperture Radar,地基SAR)系统具有非接触、高精度、大区域连续监测的技术优势,是进行区域性监测、地表形变监测以及定点连续测量的重要手段。传统地基SAR图像多源数据融合算法,一般基于坐标转换或特征匹配的方法实现,需要人工提取地基SAR系统、监测点坐标进行转换计算,难以实现自动化。利用生成对抗网络模型也可以实现地基SAR图像
近几年,中国经济发展逐步趋于稳定,绝大部分家庭均选用了汽车这一交通工具,从而使我国的汽车保有量稳步上升,但随之面临的各类交通问题也是与日俱增。为了解决这些实际交通问题,车辆再识别技术应运而生并逐渐走入人们的视野中。然而,仅仅通过车辆的颜色或车型等部分单一的车辆属性来进行车辆重识别很难取得较高的准确率。再加上真实场景下例如不明物体的遮挡、分辨率低、角度变化等诸多外界因素的影响,使得车辆重识别要想获得
燃气作为我国社区居民生活的必需品,近年来使用量不断增加,燃气安全稳定越发重要。燃气设施泄漏预警是保障燃气设施安全运行的一项重要手段,但传统的燃气设施泄漏预警方法主要依赖专家经验,实时性和智能化水平不足。本文将数据采集、视频监控、机器学习和可视化技术相结合,进行社区燃气设施风险监测和预警系统的设计。主要开展了以下4个方面的工作:(1)基于6Lo WPAN协议开发无线传感器网络采集社区燃气数据,通过树
数模转换器(digital to analog coverter,DAC)是无线通信系统中的关键模块,用于接收数字信号并完成数字信号到模拟信号的转换,因此DAC的研究也受到了广泛的关注,研制出高性能、低功耗、低面积的DAC具有深厚的研究意义。在此背景下,本次课题基于中芯国际55nm工艺,以分段式电流舵型DAC电路设计为核心,主要取得了以下研究成果:1.基于分段式电流舵型DAC电路结构,研制出了一款