基于Q学习算法的集装箱堆场翻箱落位优选

来源 :大连理工大学 | 被引量 : 1次 | 上传用户:zero_ak47
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
港口是综合交通运输网络中最重要的水陆交通枢纽,是物流供应链中最大的集货中心,随着货物集装箱化的加深,码头集装箱吞吐量逐渐增多,集装箱堆场的堆存压力日益加重,堆场资源变得紧张。为提高客户服务质量,提升港口的综合竞争力,优化集装箱码头内的调度管理至关重要。而堆场翻箱率是集装箱码头调度管理的重要指标之一,提箱过程中的翻箱落位优化可有效降低二次及二次以上翻箱率。本文针对集装箱堆场的翻箱问题,首先从进口箱翻箱、出口箱翻箱和移箱时翻箱三种情况对堆场翻箱问题进行分类分析,然后从内部因素、外部因素与其他不可抗因素等方向分析翻箱产生原因,提出从堆场管理方面降低堆场翻箱量的方法,最后确定本文的研究对象为进口箱,研究进口箱的翻箱落位优选以降低堆场翻箱率。堆场贝位翻箱问题以最小化贝位的二次及二次以上翻箱率为优化目标,贝位集装箱堆存状态和客户提箱顺序已知为前提,据此分析模型基本假设条件,对模型变量进行描述,构建集装箱堆场进口箱翻箱落位优选问题的Markov决策过程模型。为了求解翻箱落位优选模型,设计了ε-greedy Q学习算法。根据堆场各因素对翻箱率影响程度,选择关键因素对Q学习算法的多维状态空间进行表述,实时反映系统动态。确定动作集合和奖惩制度,某一翻箱作业完成后,通过立即回报反馈该动作的优劣。通过理论分析确定算法学习因子、折扣因子和探索因子随学习幕数的变化趋势,设计动作的探索策略,平衡算法的收敛性和整体最优性。最后设计不同规模贝位情况的算例,验证ε-greedy Q学习算法求解进口箱翻箱落位优选问题的性能,实验结果表明:1)Q学习算法求解结果相比Kim翻箱量估计公式,优化率在40%以上;2)相比参考算法OH算法和IH算法,Q学习算法在求解大规模问题时,二次翻箱量平均优化率分别在50%和10%以上;3)不同规模贝位单个算例的Q学习算法求解结果相对OH、IH算法改进稳定,100个算例中最多有一个算例求解结果劣于OH;最多有四个算例劣于IH。
其他文献
<正>重庆页岩气年产能已突破7×108 m3,成为全国页岩气开发的主战场之一,并被国家能源局确定为国家级页岩气示范区。重庆市国土房管局称,2014年重庆市将把页岩气勘探开发放在
因其吸收范围广、荧光量子效率高、发光光谱线宽窄、发光范围可以通过卤素组分与粒径控制实现紫外到红外的调节等优点,钙钛矿量子点作为一种新型的光电材料得到了广泛的研究,
不论是在弗里德里希﹒威廉﹒约瑟夫﹒冯﹒谢林哲学研究的方法论层面,还是在其哲学思想本身的逻辑层面,谢林由"自我"之所以能够建立起庞大的同一哲学体系,"直观"这一思想概念功不可没
独脚金内酯(strigolactones,SLs)是一类新型的植物激素,在促进种子萌发、调控植物分枝和提高抗逆能力等方面发挥着重要作用。在拟南芥中,SMXL(SUPPRESSOR OF MORE AXILLARY G
移动支付行业在中国的诞生与成长,离不开互联网经济、技术创新、宽松的监管环境的共同作用。相较传统非现金支付方式,移动支付在中国的接受度更高。在互联网经济的推动下,移
微球作为难溶药物的传输载体因其具有增加难溶药物溶解性、增强透膜吸收,靶向传输等优势而成为目前研究的热点之一。为了解决传统方法所制备的微球粒径不均一的问题,本论文采
行人在道路交通事故中属于弱势群体,其严重损伤或致死的概率相对于其他交通事故形态更高。自动紧急制动(AEB)系统能够有效减少或避免行人伤害。为对AEB系统有效性进行验证评价,各国出台了相关的新车评价规程,但是借鉴国外的测试场景不能够反映对中国道路交通特征,因此基于中国道路交通事故的场景研究有其必要性,能够为我国行人AEB测试场景的建立、行人AEB系统控制策略的设计提供参考。本文主要研究内容有以下四个
目的:探讨儿童哮喘发作与肺炎支原体(MP)感染之间的关系,并分析合并MP感染的患儿的临床表现。方法:将79例2-14岁急性哮喘发作的患儿依据病史分做两组:第一次哮喘发作的35人(
稀土离子掺杂的上转换纳米材料与量子点、有机染料相比有较高的化学稳定性、较窄的发射光带、较大的寿命、较高的荧光效率和较低的辐射背景,并且在太阳能电池、光信息编码、
本研究的目的是应用黑木耳超微粉,配以米、豆、干制坚果及浆果等其它原辅料,研究出一种具有降脂功能的强化营养粥,为黑龙江省黑木耳产业的发展、提高黑木耳产品附加值提供一