【摘 要】
:
随着大数据对供应链渗透程度的加深,库存决策进一步摆脱了对需求分布假设的依赖,数据驱动报童成为了供应链决策优化问题与人工智能方法融合的研究前沿。人工智能中,深度强化学习具备感知环境的能力与超越人类顶尖水平的潜力,在游戏、金融等领域成绩斐然,供应链领域对其的应用也如日方升。因此,本文致力于将深度强化学习引入数据驱动报童,为供应链决策优化注入新的科技内涵。作为开创性地将强化学习与深度学习相结合的经典深度
论文部分内容阅读
随着大数据对供应链渗透程度的加深,库存决策进一步摆脱了对需求分布假设的依赖,数据驱动报童成为了供应链决策优化问题与人工智能方法融合的研究前沿。人工智能中,深度强化学习具备感知环境的能力与超越人类顶尖水平的潜力,在游戏、金融等领域成绩斐然,供应链领域对其的应用也如日方升。因此,本文致力于将深度强化学习引入数据驱动报童,为供应链决策优化注入新的科技内涵。作为开创性地将强化学习与深度学习相结合的经典深度强化学习算法,深度Q网络(DQN)能够应对各种挑战性任务。但经过在报童环境下的算法再设计与仿真实验,发现其难以直接利用并适应供应链决策环境。因此,区别于以往算法仅学习环境(大数据),本文从“人机协同”的视角出发,设计学习人类经验的智慧报童深度强化学习算法。其中“人”是数据驱动报童理论成果,“机”是DQN,“协同”是理论作为老师在学生DQN与环境互动的闭环链路进行指导。具体设计为前期将老师上一期的理论解与成本作为学生的输入,即传授经验;中期基于老师的行为限制学生的行动范围,即规范决策;后期根据学生偏离老师的程度给予反馈,即正则回报。因此,算法的“智慧”表现为针对环境中的问题,基于老师所刻画的人类理性行为这一知识与可获得的部分信息,学习并决策的能力。通过实验、实测以及将两者结合的迁移学习这三种方式进行评估,结果表明:实验中,智慧报童较DQN能够更快更稳定地收敛于完全信息下的理论最优解,在效率效果上有显著提升;实测中,较DQN以及其他基于模型(参数估计)和数据驱动(经验分布和SAA)的方法,智慧报童也能达到更优的绩效水平;行为上,智慧报童兼备稳定与灵活的特征,人机协同机制能够避免随机探索难以快速收敛稳定与陷入局部最优后难以脱离的弊端,在固定值附近的小范围波动以更好地适应不确定的需求变化。最后迁移学习提供了实验与实测相融合的路径,进一步增强了算法的适应性,为企业提供智慧化决策的工具。
其他文献
中药的治疗功能是建立在多种有效成分联合作用的基础上,研究中药多种活性成分与血浆蛋白的结合特征,对阐明中药的协同作用机制和中药现代化具有重要意义。然而,目前的研究主要集中在中药单一活性成分与蛋白质的相互作用方面,难以解释中药整体治疗机制。因此,本文发展了平衡透析法可同时研究多个成分与蛋白质分子的相互作用,并将其成功应用到中药黄芩提取物中多成分与蛋白质的结合研究,为科学解释中药整体作用机制提供了理论基
亲电交叉偶联已经成为有效构建碳-碳键的一种非常高效且强大的策略。虽然镍催化的交叉亲电偶联反应中取得了很多进展,但对于惰性底物的研究仍然较少。由于铁催化剂具有环境友好等特点,因此发展铁催化还原偶联的方法构建碳碳键具有重要的意义。本工作发展了一种以溴化亚铁(Fe Br2)为催化剂,联硼酸频哪醇酯(B2pin2)为还原剂,以二(金刚烷-1-基)(丁基)膦(cata CXium A)或N,N,N’,N’-
在生物医药领域,如何准确、高效的调节生物过程具有重要的研究价值。近年来,光遗传学技术实现了在细胞水平上精准调控生物信号和蛋白功能,展示出广阔的应用前景。光遗传学整合了光学和遗传学的优点,通过在细胞水平靶向表达光感应蛋白和功能蛋白,并以特定波长荧光蛋白示踪,再利用特定波长的光信号诱导光感应蛋白结构和功能发生变化从而影响功能蛋白的作用,进而达到准确调节细胞信号的目的。光感应蛋白和荧光蛋白都需要吸收特定
随着抗生素和有机磷农药(OPs)在畜牧养殖和农业生产中的广泛应用,其在农作物产品和食品中的残留威胁着人们的健康。传统的抗生素和OPs的检测方法包括色谱法如气相色谱法(GC)、高效液相色谱法(HPLC)、GC-MS法和HPLC-MS法等,电化学传感器法及化学发光法等,它们通常耗时长、成本高、前处理复杂,难以满足快速检测的需求。相对而言,基于抑制酶的催化作用进行检测的方法具有简便、成本低、高效、灵敏度
随着细菌耐药性问题不断发展,临床上能有效治疗细菌感染的抗生素越来越少。为了有效治疗由多重耐药菌引起的感染并减少细菌多药耐药性的产生,非抗生素治疗细菌感染的策略不断涌现。其中一氧化氮(NO)疗法是治疗耐药细菌及其生物膜感染的一种新兴策略。根据浓度的不同,NO可以诱导生物膜扩散,增加细菌对抗生素治疗的敏感性,并通过活性氧或活性氮的形成诱导细胞损伤或细胞死亡,同时避免了细菌耐药性的产生。但是,NO的使用
随着数字化进程的不断加快,数字化赋能制造业已成为经济高质量发展的“新引擎”。为鼓励企业进行数字化转型以降低生产成本并提高产品质量,政府通常会对智能制造标杆企业和上云的中小微企业提供政策补贴。而制造商的数字化赋能还能扩大市场需求,使得下游零售商产生了共享需求信息的动机。然而,并不是所有的制造商都愿意进行数字化转型,原因在于数字化投资决策往往还受到数字化赋能效率、政府补贴力度、生产成本的节约效果、消费
过氧化物酶是最重要的天然氧化还原酶之一,广泛应用于免疫测试、食品加工和工业污水处理中。然而,天然过氧化物酶的大规模应用受限于过高的制备成本、苛刻的储存条件、极端环境下的活性不稳定等。自2007年发现Fe3O4磁性纳米粒子具有过氧化物模拟酶活性以来,越来越多的研究人员致力于过氧化物模拟酶的开发。然而,纳米材料模拟酶(纳米酶)的合成需要较为苛刻的实验条件、复杂的操作,且存在生物相容性差和批次间差异较大
随着工业、制药业及养殖业等各行业的快速发展,染料、抗生素等有机污染物被排放到环境中,对生态系统和人类的健康发展造成了极大威胁。光催化技术能够利用太阳能降解有机污染物,具有清洁、高效及无二次污染等优点。作为一种多孔晶体材料,金属有机骨架(Metal-organic frameworks,MOFs)是由金属离子或金属簇与含氧、氮等有机配体构建而成,具有不饱和金属位点、比表面积大、孔隙率高、孔道结构及性