基于逆向强化学习的装船时堆场翻箱智能决策

来源 :同济大学学报:自然科学版 | 被引量 : 0次 | 上传用户:nadiazhao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
集装箱码头装船时堆场翻箱具有时序性与动态性,属于NP(non-deterministic polynomial)难问题。针对常见的顺岸式集装箱码头堆场,以最小化总翻箱次数为优化目标,考虑翻箱对装船连续性及效率的影响,基于马尔科夫决策过程构建装船时堆场翻箱模型,设计逆向强化学习算法。为验证算法的有效性,以随机决策为基准,将设计的逆向强化学习算法与码头常见规则决策、随机决策对比。结果表明,贝位堆存状态不佳时,常见的规则决策不一定优于随机决策;逆向强化学习算法可有效挖掘隐含专家经验,收敛至最小翻箱次数的概率更高
其他文献
将零售商的公平关切行为引入到双回收渠道闭环供应链,构建了具有零售商公平关切的3种决策模型,运用博弈理论对其进行分析求解。重点分析了零售商的公平关切行为对不同模型中各渠道成员的最优决策和绩效水平的影响,并利用数值仿真对所得结论进行了验证。研究结果表明,零售商的公平关切行为对各渠道成员的最优策略有很大影响,包括产品批发和零售价格、逆向渠道回收率;同时该行为倾向可为零售商谋取更大的期望效用,但会损害制造商的期望效用,而对第三方期望效用的影响趋势不同。此外,零售商的公平关切行为对3种决策模型总期望效用的影响趋势不
当相容的线性代数方程组的右端向量发生扰动时,给出了由贪婪随机Kaczmarz方法所产生的迭代解与原线性代数方程组的最小范数解之间的期望误差的上界,并说明了随着迭代步数的增长,该期望解误差以线性速率下降至一个给定阈值。数值实验表明,该阈值能够很好地估计贪婪随机Kaczmarz方法的迭代解误差所能达到的最小值。
半导体产业是现代信息社会的基石,是契合节能减排、智能制造、信息安全等国家重大战略需求,支撑新一代移动通信、新能源汽车、高速轨道列车、能源互联网等产业自主创新发展和转型升级的重点核心材料和电子元器件产业,是支撑当前经济社会发展和保障国家安全的基础性、战略性和先导性产业,是信创产业的核心和基石。天津下一步应加强半导体产业重点承接平台建设,确保转移来津项目留得住、发展好,推动经济高质量发展,加快推进承接北京非首都功能疏解。
鉴于女性盆底功能障碍性疾病具有较大患者群体,经市卫健委规划主导,由天津医科大学第二医院牵头与天津市妇女儿童保健中心及18个区县妇幼保健机构联合组建了“女性盆底功能障碍防治医疗联合体”,目的是共同承担市妇女盆底功能障碍性疾病的预防筛查、诊治康复工作。医联体以松散结构存在,主要是以技术支持为纽带,通过技术指导、人员培训、资源共享、合作科研和双向转诊等方式,实现对女性盆底疾患“防治功能覆盖、诊疗水平提升”的功能,同时也强化了“关联专科医联体”自身建设,并逐渐展现出良好的合作前景,实现盆底疾病分级诊疗的格局。
在石油开发工程中,由于在渗透率低且岩性较为坚硬的储层采用水力压裂效果不佳,重复强冲击技术应运而生。利用岩石冲击损伤模拟实验装置和单轴刚性液压机,对不同加载速率和不同冲击次数条件下饱和、干燥和不同渗透率的岩石进行重复冲击实验,测量不同重复加压阶段岩石渗透率的变化情况。实验表明:岩石强度随加载速率的提高不断变大,随重复加载次数的增加而逐渐降低,裂缝条数随冲击速率的增加而增多;单次加载岩石渗透率有先减小后稳定再增大的变化;在不同阶段重复加载渗透率有不同的变化。
目前复合材料与工程专业在风电叶片制造行业得到深入且广泛的应用,通过介绍结合复合材料在风电叶片行业的应用实例,总结了如何将专业知识运用到工程实践中。阐述了推进产学研深度融合,勇于向世界性难题挑战的创新精神,是提升个人专业技术水平以及企业核心竞争力的根本途径。
煤改气是对环境污染的一种治理方式,为此需要大量铺设燃气管道,燃气管道用涂料也相应大幅度增加了用量,但是燃气管道涂料存在VOC排放高、涂膜易破损等缺点,需要改进。针对燃气管道的应用特点开发聚脲燃气管道专用防护涂料产品,使得聚脲涂料能够很好地在燃气管道上进行涂装使用。
为了解期刊引用文献的规律和吸收利用信息的能力,运用文献计量学的方法,对我国10种园艺类核心期刊2019年第1期所发表的论文参考文献情况进行了统计与分析。结果表明:我国10种园艺类核心期刊的引文数相对较低,与SCI收录的园艺期刊还有一定差距;引用文献以中文为主,外文引文量较低,引文语种单一;引文的新颖性较差。今后期刊编辑部应进一步提高写作者对文献信息的利用意识,重视论文参考文献的著录。
结合高校实验室管理工作的具体需求,基于微信HTML5页面灵活的开发环境,使用Java的框架和ORACLE数据库进行后台处理,利用计算机管理技术,建立实验室教学管理平台。在系统中公布实验室当前功能信息、使用状态、开放时间和开放项目等,并采用实名制预约形式,方便教师和学生通过网络实时查看实验室开放情况。系统可以更好地利用实验室的宝贵资源激发学生学习的积极性。
在混凝土静力弹塑性损伤理论的基础上,提出有效损伤驱动力的概念,引入微惯性和微黏性以考虑混凝土微细观裂纹动力演化的率敏感性所导致的材料应变率效应,建立了适用于强动力作用下混凝土结构响应分析的动力损伤本构模型。利用数值分析得到的混凝土应力应变全曲线和动力提高因子表明该模型能够反映材料在中、高应变率作用下的动力力学性能。对Hopkinson杆的数值模拟,也表明了所提出模型的有效性。