非参数设定下库存管理问题研究

来源 :西南财经大学 | 被引量 : 0次 | 上传用户:dachenggege
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
库存管理是现代企业运营中非常重要的一部分,其与企业的利益息息相关,一个有效的库存控制策略不仅可以降低企业的库存成本,还可以减少企业因缺货而造成的销售和商誉损失。反之,一个低效的库存控制策略会增加企业的相关成本和损失,进而影响企业的生存与发展。库存管理的目标旨在帮助企业在不同条件的约束下进行合理的库存决策,支持企业的生产与运作。因此,如何将库存保持在合理的水平同时构建一套有效的库存管理系统,是一个现代企业构建核心竞争力和实现长久发展的关键。随着经济社会的发展,企业面对的环境愈发复杂,这极大地增加了企业的运营难度并且使得企业既有策略效果受到了极大的挑战。与之相对的,近年来随着信息科技的全面渗透以及数据挖掘技术的进步,企业开始步入大数据时代,这也使得企业收集信息的能力大大提升,数据已经成为企业的宝贵资产。在此背景下,企业如何利用数据来应对日益加剧的竞争以及把控需求的不确定性成为了企业可持续发展的重中之重。因此,基于数据驱动的库存管理研究符合现实情况并且具有十分重要的现实意义。在库存管理问题中,决策者需要在需求未知时决定商品的库存水平并以此来满足未来需求。传统的库存研究中,研究者假设需求分布完全已知,以此来做出库存决策。但随着商业环境的剧烈变化,需求的不确定性大大增加,因此基于随机需求的库存控制应运而生。近些年来,数据驱动的库存管理问题成为了一个重点研究方向,该类研究根据历史需求以及其它可获取的数据进行库存管理的建模与决策。本文紧跟这类研究范式,在需求非参数设定下研究了常规品与易腐品的库存管理问题。对于常规品,本文研究了一个数据驱动的二维决策多阶段报童问题。相较于单决策变量的多时段报童模型,本文引入了提前订货决策变量。本文将一维的弱集成算法推广到了二维情形,解决了此二维库存决策问题。区别于常规品,易腐品的库存控制需要在库存决策中考虑保质期对决策的影响,商品只有在固定的或随机的一个较短期限内能被用于满足需求,超过这个期限将被废弃,比如血液制品等。本文研究的多期定价与库存联合决策易腐品问题,是传统的动态规划方法难于解决的。本研究还考虑了正交货期以及固定订货成本等库存决策影响因素,进而问题的复杂度还会大大增加,难以用传统方法求解。针对问题的复杂性,本文使用深度强化学习算法来解决易腐品库存与定价的联合决策问题,利用神经网络的拟合特点有效的避免了维数问题。具体来讲,本文的主要研究内容有以下两个部分:第一:数据驱动的二维多阶段报童问题研究。本研究将基于常规品的一维多时段报童问题拓展为二维多阶段报童问题,即整个研究期包含多个阶段,每个阶段包含多个时段。在每个阶段的开始决策者需要为本阶段内的每个时段决定一个相同的提前订货规模并以此获取提前订货折扣,除了提前订货,每个时段决策者还可以进行常规订货。本研究中没有对需求进行任何的假设,决策者能观察的数据仅有实现了的历史需求。本文将基于专家意见的一维在线弱集成算法拓展到二维情形来解决这个二维决策问题。该问题的一个难点在于常规订货决策经验的跨阶段传递。针对这一难点,本文设计了一个跨阶段的经验继承规则来调整常规订货决策,最终得到了提前订货和常规订货的在线订货解决方案。通过理论推导,本文得到了提前订货规模以及常规订货量的显示解,并且利用收益函数具有的单调性及其性质,从理论上证明了研究中提出的策略得到的研究期总收益以及阶段内总收益针对于最优策略表现的收敛性。数值实验以及灵敏性分析结果验证了本文提出的算法的有效性。第二:基于深度强化学习的易腐品定价与库存联合决策。本文考虑了当商品为有限保质时间的易腐品库存管理问题。易腐品的定价与库存管理,是传统的动态规划方法难于解决的问题。其原因是易腐品的库存状态需要用向量来表示不同剩余保质期的商品。此外,本研究还考虑了正交货期以及固定订货成本等现实库存决策影响因素,因此问题的复杂度还会大大增加,难以用传统方法求解。针对问题的复杂性,本文构建了深度强化学习算法求解此复杂易腐品联合定价的库存控制问题,其中主要运用神经网络的拟合性克服维数问题并实现对状态-动作价值的刻画。同时此方法下,决策者能够获得的需求信息来源于环境的收益反馈。为了验证深度强化学习算法的有效性,本文通过未卜先知的需求数据设计了一个理论利润最优上界,同时将提出算法与其它方法进行了比较。数值实验验证了本文提出算法的性能有效性,尤其在考虑本文提出的所有库存决策影响因素时,深度强化学习算法显著的好于传统方法。对比实验也显示深度强化学习算法很好的避免了传统方法会造成的无法计算的维数灾难问题。实验还展示了动态定价对于易腐品库存控制的重要性。最后,本文讨论了不同条件下学习到的订货定价策略所具有的不同性质,进一步丰富了复杂条件下最优策略性质讨论的研究。从理论层面,对于常规品,本研究丰富了多时段报童问题的研究,考虑了提前订货折扣,将一维决策变量的多时段报童问题拓展为二维决策变量的多阶段报童问题。并针对此二维问题设定提出了多阶段弱集成算法,拓展了解决一维决策问题的弱集成算法。通过推导以及利用收益函数所具有的单调性及性质,给出了相应订货策略的显示解以及研究期累计收益和阶段内总收益的理论性能保障,丰富了研究的理论结果。在研究复杂易腐商品库存管理问题时,本文考虑了许多现实存在的库存决策影响因素,丰富了易腐商品的库存管理研究,并且针对传统动态规划方法在应对此复杂问题时容易陷入维数问题无法求解,本文利用深度强化学习算法很好的解决了提出问题并获得了不错效果,验证了深度强化学习算法在易腐品联合定价的库存控制问题中的运用前景。从应用层面,本文所考虑的库存决策影响因素以及问题设定在现实生活中已有相应的场景,并且实验也验证了本文所提方法的有效性,因此这些方法具有潜在的现实运用价值,可以用以指导解决实际问题。
其他文献
The study at hand attempted to analyze the efficiency and productivity of Ethiopian commercial banks from 2010–2019.This is a period in which the country developed and implemented its growth and trans
学位
双循环发展格局的实现依赖国内统一大市场的构建,长期以来我国区域之间市场存在严重的分割并引起了学者和政府广泛的关注,然而由于数据的限制,已有研究关于市场整合的测算局限在省级层面,我国城市间的市场整合程度究竟如何?同时,已有研究关于市场整合的研究停留在地区个体层面,缺乏地区之间至全局的系统探讨,我国城市市场整合网络的总体和局部呈现何种特征?自加入世贸组织以来,中国通过融入世界实现了经济的高速发展,一跃
学位
结合理论分析与实证研究方法,本文探究了上市公司管理层披露、媒体报道、网络论坛所呈现的文本语调信息与上市公司市场表现的关系。不同来源的文本语调信息在上市公司存续的不同阶段产生不同的影响。本文构建理论分析模型,分析了企业所有权性质、政府补助与管理层披露动机对文本语调作用的影响,并在实证分析中进行检验。同时基于信息不对称理论和行为金融学理论,着眼于IPO首日回报率,以及后续经营发展过程中的长期超额收益和
学位
如何控制快速增长的医疗费用一直是我国医药卫生体制改革面临的主要挑战,其中药品费用的居高不下更是一大难题。高昂的药品费用构成中国医疗可及性的主要障碍,不仅增加了患者和家庭药品使用的经济负担,而且给医疗保障资金的可持续带来压力。另外,高昂的药品费用也加剧医药市场和医疗服务过程中的行为扭曲,造成药价虚高及不合理/过度用药等一系列医药资源的巨大浪费。药品价格作为药品费用主要组成部分,也是医药市场资源优化配
学位
区位导向型政策一般是指政府在指定区位设立鼓励性条件从而吸引和引导企业投资行为的政策,而开发区就是一种典型的区位导向型政策。从1978年到2018年,中国区位导向型政策作为跨越四十周年的改革开放的重要成果,充分体现了从经济特区到各类开发区的区位导向型政策建设的历史功绩。近年来,全球新兴市场国家展露出经济崛起的盛况,而这难以用传统国际商务理论和实践经验解释,引起了学界广泛的关注。中国作为新兴市场的代表
学位
疫病不同于时病,时疫也不能涵盖所有的疫病。新型冠状病毒肺炎(简称“新冠肺炎”)疫情前所未有的时空跨度,给传统中医疫病理论带来了诸多挑战,如非时疫类疫病的中医属性如何判定、无症状感染者的防治方案如何制定等。针对这些问题,结合中医学对新冠肺炎的临床实践和对既往疫病“因机证治”的综合分析,发现“戾嗜”(戾气对理化环境的亲嗜性)是解决这些问题的重要突破口。通过对相关病原体“戾嗜”的判定,可以为“非风、非寒
期刊
近年来,随着人们生活水平的逐渐提高和对旅游品质的追求,满足个性化需求的旅游服务定制已呈现快速增长的态势。与常规的旅游产品相比,旅游服务定制产品具有高度个性化和细分化、较高产品定价和高运营成本等特点。如何降低顾客对旅游服务定制产品的价格敏感性,维持与顾客的长期合作关系是旅游服务定制企业在经营管理中亟待解决的一项难题。因此,如何适应顾客消费升级需求,加快旅游服务定制健康有序发展,推动旅游业企业转型升级
学位
随着中国经济由高速发展到高质量发展的转变,中国保险业逐渐步入高质量发展阶段。在中国保险业长期发展过程中,市场的信息不对称、道德风险与逆向选择等问题一直存在,保险消费者效用最大目标与保险公司利益最大化目标不一致导致保险纠纷频繁发生。自1980年中国恢复保险业务以来,追求保险业高速发展产生的弊病逐渐显现,销售误导与理赔难等问题禁而不止,保险消费者权益侵害现象客观存在,一定程度上影响了保险业形态,已阻碍
学位
增长与分享、效率与公平是人类永恒的研究主题。《国民经济和社会发展第十四个五年规划和2035年远景目标纲要》要求优化收入分配结构,坚持居民收入增长和经济增长基本同步、劳动报酬提高和劳动生产率提高基本同步,持续提高低收入群体收入,扩大中等收入群体,更加积极有为地促进共同富裕。改革开放以来,我国生产力快速发展,创造了增长奇迹,但劳动收入未能与经济增长和劳动生产率基本同步提升,劳动收入份额在国民收入初次分
学位
2019年末至2020年初,武汉地区暴发新型冠状病毒肺炎,仝小林院士在一线抗疫60余日。在此期间,他提出和制定了诸多学术观点和实践方案:1)创“三维定性”之法,并依此而将武汉新冠疫情定性为“寒湿疫”。2)针对“寒湿疫”早期,制宣肺化湿之法,并依此开具寒湿疫方,对疫情进行早期截断。3)创“武昌模式”高效有序推行寒湿疫方,将防控重心下沉前移至社区。4)针对“寒湿疫”重症期,发现“瘀热入营”是转重之关键
期刊