基于强化学习的机票动态定价研究

来源 :中国民航大学 | 被引量 : 0次 | 上传用户:jackywang1980
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机票定价是指航空公司制定机票售价策略,将不同票价等级的机票适时地销售给不同的消费者以最大化航班座位收益,是提升票务收益的主要途径。现有机票定价研究存在两点不足:(1)定价策略建立在已知需求曲线的基础之上,其中曲线是通过历史数据拟合或分布假设而生成的,定价策略会因需求量预测偏差而降低性能。(2)定价策略是静态的,仅根据不同时间、航班剩余座位数等因素触发机票价格的调整规则,无法根据市场销售情况实时调整价格,影响整体收益。针对上述问题,开展基于强化学习的机票动态定价研究,旨在利用强化学习构建具有最大累计期望收益的实时动态定价策略。值得强调的是,机票动态定价并非大数据杀熟或因人设价,所有旅客在同一时刻享受相同的机票价格,只是价格会随销售时间、竞争与合作、航班剩余座位数等因素而动态变化。因此,如何构建适应实际需求环境且具有最大收益的售票策略成为机票动态定价面临的主要挑战。为解决上述问题,提出基于环境模型仿真的机票动态定价算法,其核心是将民航机票动态定价问题建模为马尔可夫决策过程,状态为航班定价时刻和当前剩余座位数,动作为票价等级。首先统计各票价等级的需求量以构建环境模型,在此模型的基础上进行规划产生每一个动作的模拟经验,通过回溯模拟经验更新价值函数,在反复迭代后学习系统将获得使得收益最大的动态定价策略。根据两趟航班实际订票数据分别进行104组和92组实验,仿真结果表明:执行动态定价策略下的收益相比于航班实际收益平均提升22.16%和14.10%。并通过实验分析了航班定价次数对模型性能的影响。由于基于环境模型的强化学习算法无法完全考虑环境随机性,同时在样本采集中又无法避免抽样误差,提出了一种基于策略学习的机票动态定价算法。其核心是不再直接预测各票价等级的需求量,而是将机票动态定价问题建模为离线强化学习过程,仅用航班当前剩余座位数描述状态信息。通过设计定价策略评估和策略更新的方式,从历史购票数据上学习具有最大期望收益的机票动态定价策略。在海量民航旅客订票日志上针对两趟航班分别进行717组和610组模拟定价实验,结果表明:相比于现行机票销售策略,策略学习算法在票务收入上的提升率分别为30.94%和39.96%,且比需求量预测方法提升了6.04%和3.36%,显著表明算法的有效性。
其他文献
航空发动机的高压涡轮叶尖径向间隙对发动机性能和工作效率具有很大影响,过小的叶尖间隙会导致叶片与机匣的碰磨,而过大的间隙会导致燃气流动损失加大、燃油消耗增加,因此开展间隙研究以及间隙优化具有重要的意义和价值。本文针对CFM56-7B发动机高压涡轮结构,选用有限元数值仿真,建立流热固耦合模型;结合QAR数据及热力分析确立热边界条件;采用有限元软件对流热固耦合问题进行求解,得到不同工况下高压涡轮叶片、轮
学位
随着我国经济不断发展,军民航由于空域资源分配问题而产生的矛盾也不断凸显,较少的民航空域占比导致航路拥堵,航班延误现象时常发生,为实现对空域资源的灵活使用,优化空域结构,我国实施了临时航线政策,但现有临时航线多以两航路点间直线段为主,缺乏科学理论依据,因此本文对临时航线划设时的相关问题进行了研究。首先,通过对特定空域范围内的扇区繁忙程度进行定量计算,寻找临时航线划设需求旺盛区域。从静态航路网络结构指
学位
学位
在航空领域,飞机结冰不仅会造成很大的经济负担,更重要的是对飞行安全产生严重的威胁。研究表明,疏水性材料表面具有良好的抑冰效果,而构建材料表面微结构可以实现表面疏水。激光加工诱导微结构表面因其加工效率高、方法简单等优点在众多微结构制备技术中脱颖而出,利用激光诱导钛合金制备周期性微纳结构解决飞机结冰问题成为目前研究的一个重要方向。本文首先采用激光加工技术(包括飞秒激光和纳秒激光)对钛合金表面进行激光加
学位
在“一带一路”发展的大背景下,地区和国家之间的合作与联系日益增多,而通畅有序的物流运输为其提供了一定的基础保障。多式联运依靠运输过程一体化的优势,可以有效地整合各种运输资源,合理匹配不同方式之间的衔接,推动实现物流业降本增效和绿色低碳发展。随着中蒙俄间的贸易结构正由能源和农业产品等传统领域向航空航天类、精密仪器以及医药等高新技术领域拓展,空地联运作为“空运+陆运”的货物多式联运方式,在运输时效性和
学位
飞机起降滑跑时,前轮或者主轮可能发生一种偏离其中立位置的剧烈摆动。这是一种以机轮摆动为主,伴随机身抖动和轮胎变形的自激振动,称为摆振。摆振现象在民用飞机、军用飞机和无人机等各类飞机中广泛存在。磁流变减摆器因具有阻尼力可控且调解范围广等诸多优点,被期待能更好地实现摆振抑制功能,以弥补当前广泛应用的油液式减摆器存在的阻尼力不可控、摆振抑制品质低等不足。基于磁流变减摆器的前起落架减摆系统中存在广泛的响应
学位
随着互联网的快速发展以及旅客对于航空服务的个性化需求日益强烈,民航旅客服务推荐方法引起了越来越多学者的关注。然而,随着民航旅客服务项目的不断丰富,信息过载问题愈演愈烈。目前民航旅客服务推荐面临的主要问题是民航旅客服务的个性化主动推荐准确性和数据的稀疏问题。旅客与航空项目的交互数据构成了图结构,且图神经网络技术具有良好的非线性表达能力和隐式特征挖掘能力。因此,本文通过图神经网络技术并结合社会网络关系
学位
近年来,中国民航发展速度较快,与此同时航班延误情况较为严重。航班延误一旦发生,不仅是单次效应,还会借由航班串影响后续航班,甚至波及到整个航空运输网络,造成大面积航班延误。因此,对于航班延误的控制显得尤为重要。本文首先从航班延误的事前控制出发,建立了航班计划优化模型,将软备份运力合理分配在飞行时间和过站时间中,提高了航班的正常率、起飞的准点率和航班串的鲁棒性。为了让航空公司更好地应对航班延误,本文从
学位
2020年10月4日,吉尔吉斯斯坦如期举行议会制时代以来的第三次议会选举。在选情与疫情交叠冲击下,败选的反对派政党以街头暴力方式终结了民选总统热恩别克夫政权。从议会选举到政治变局,议会制政体建立十年后的政治动乱,造成总统的第三次非正常更迭,吉尔吉斯斯坦政治发展再遭挫折。吉尔吉斯斯坦独立以来困扰许久的政治失序问题再次引起国际学术界诸多关注。本文通过对现有国内外有关政治稳定和政治发展学术研究的基础上,
学位
生活中的复杂系统经由非线性相互作用,体现出多标度、多层次等特征,其本身结构较为复杂,难以直接分析,故选择对高层次得到的时间序列进行分析.在大数据时代下应用时间序列分析方法探究数据的内在价值具有越来越重要的意义.本文提出了新的方法来描述时间序列的复杂性.首先向累积剩余熵(CRE)引入分数阶q,使其变为分数阶CRE,实例表明分数阶累积剩余熵(FCRE)比CRE更为敏感,描述复杂系统更清晰.其次,将FC
学位