【摘 要】
:
利用深度强化学习技术实现路口信号控制是智能交通领域的研究热点。现有研究大多利用强化学习来全面刻画交通状态以及设计有效强化学习算法以解决信号配时问题,但这些研究往
【基金项目】
:
浙江省公益技术研究计划项目(LGG20F030008),浙江省自然科学基金项目(LY20F030018)
论文部分内容阅读
利用深度强化学习技术实现路口信号控制是智能交通领域的研究热点。现有研究大多利用强化学习来全面刻画交通状态以及设计有效强化学习算法以解决信号配时问题,但这些研究往往忽略了信号灯状态对动作选择的影响以及经验池中的数据采样效率,导致训练过程不稳定、迭代收敛较慢等问题。为此,文中在智能体模型设计方面,将信号灯状态纳入状态设计,并引入动作奖惩系数来调节智能体动作选择,以满足相位最小绿灯时间和最大绿灯时间的约束。同时,结合短期内交通流存在的时序相关性,文中采用优先级序列经验回放(Priority Sequence E
其他文献
医学图像具有内容丰富多样、特征丰富、多尺度等特征,因此对医学图像的分割比一般图像的难度更大。针对上述问题,提出了基于改进粒子群优化三维Otsu方法的医学图像分割算法。由
随着养殖水平不断提高以及居民对猪肉制品消费和需求的不断增加,我国生猪养殖规模的不断扩大,目前生猪存栏量、出栏量均较前期有所提高。我国养猪业在不断发展的同时,也在面
纸币是由国家发行的作为法定通货的纸质货币.中国是世界上第一个使用纸币的国家,早在汉武帝元狩四年(公元前119年)的白鹿皮币,即每平方尺的白鹿皮饰以彩画,当钱40万,这种皮币
国企改制不仅对搞好国有企业具有重要意义,而且对建立我国现代商业银行有着直接的影响,因此,银行在企业改制过程中应责无旁贷地支持企业改制.但是,由于一些企业在改制过程中
随着多体系统动力学理论和计算机技术的发展,矫形器的计算机辅助设计和制造(CAD,CAM)技术已经日趋成熟,利用这项新技术可建立人体和矫形器的数学力学模型,通过模拟计算来确定矫形器
9月百城新建住宅均价同比保持上涨态势,但涨幅不大。短期来看,房价大涨的概率不大。在因城施策环境下,部分房价、地价存较强上涨预期的城市仍会进一步升级楼市政策,以稳定预期。 9月房价小幅上涨 9月房价持续上涨,不过涨幅依旧维持在合理范围之内。 根据中国房地产指数系统对100个城市的新建住宅样本调查数据,2020年9月,百城新建住宅均价15643元/平方米,同比上涨3.26%,涨幅较上月收窄0.0
苦其心志管贷款,13年防范信贷风险见成效,在许多信用社大面积亏损,不良贷款居高不下的情况下,大荔县城关信用社的经营好象沙漠上的一片绿洲,令人神往.大荔县城关信用社截止19
针对传统分布式日志系统存在的问题,提出了一种高性能低时延的分布式日志系统方案。通过多项关键技术,有效提升了设备和日志服务器之间通信的吞吐量,降低了传输时延,减轻了对
目的研究Notch基因在小鼠牙髓干细胞样细胞表达.方法采用酶消化培养法获得小鼠的单个牙髓细胞悬液,调整细胞密度为1×10 4个/孔细胞,干细胞培养液培养14 d,挑选细胞克隆
[目的]了解全国31个省(自治区、直辖市)中医药健康产业的竞争力水平。[方法]采用因子分析、层次聚类分析等统计分析方法评价我国31个省(自治区、直辖市)中医药健康产业的区域