基于LightGBM与WaveNet模型融合的酒店线上销量预测方法研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:liyunfeng890406
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,中国旅游市场保持持续发展的态势,互联网不断渗入到国民生活的方方面面,用户倾向于通过网络预订酒店,拥有大量酒店的线上旅行平台积累了庞大的酒店、用户消费数据。酒店的销量是收益管理的基础和核心。如果通过现有的技术和方法预测到未来某段时间内特定酒店的销量变化,一方面有利于指导酒店库存管理进而提高收益管理效益,另一方面也能提高用户体验,给整个平台带来收益。由于酒店线上销量在不同时间段受到酒店本身属性、价格、节假日等众多因素的影响,传统的时间序列预测方法不能充分挖掘数据特征及高效处理高维、非线性大数据,预测误差较大,针对这样的问题,提出了一种基于LightGBM与WaveNet模型融合的酒店线上销量预测方法。研究的主要工作有:对历史数据进行分析与处理,包括缺失值及脏数据,分析不同维度销量数据,描绘酒店销量数据的特性,选取合理的预测时间范围。组织特征工程,一类为基本特征,包括地区、商圈、酒店属性、节假日时间等维度的基础数据,针对中国节假日时间独有特性对其进行编码,将非数字的特征进行独热编码;另一类为基于时间序列的数学统计特征,根据目标预测时间范围,在不同的时间窗口、组合交叉等特征组合中提取不同的统计数据。构建了基于LightGBM算法的销量预测模型,LightGBM具有内存需求小、计算速度快、通信代价小的特点;构建基于WaveNet的销量预测模型,WaveNet是一种自回归的深度生成模型,通过使用多层扩张因果卷积(Dilated Causal Convolution)扩大感受野(Receptive Field)来表达更多的时序特征,采用残差网络结构以及参数化的跳跃链接来提高训练深度。它在深度学习中对于音频分析所取得的成果比之前所有模型的效果都要好,同时本文结合序列到序列的预测框架,创新性地将改进的WaveNet应用于酒店线上销量预测。由于两个模型分别具有不可替代的优势,最后,将两个模型做线性融合,提高了模型预测的准确性,并利用OTA平台真实的销量数据进行一系列的实验证明了算法模型的高效性能。
其他文献
本文主要解决深空探测卫星自主导航相关问题,这可使得卫星能够不依靠于地面设备实现自主定位。本文主要依靠天体信号来设计导航算法,并通过数值仿真验证其可行性。本文首先对
“三北”地区风能资源丰富,为充分利用风能资源,满足该地区供电和供热需求,一般由火电、风电和热电联产机组联合完成供电和供热任务。由于风电的反调峰性和热电联产机组的“以热定电”运行方式,导致电网调峰能力不足,造成了严重的弃风问题。为此,本文提出在热电联产系统中安装电锅炉解耦“以热定电”约束,同时在用户侧采取需求响应措施,提升风电消纳能力。主要工作及成果如下:为改善风电和热电联产联合系统中的“风热冲突”
在如今的互联网时代,技术飞速发展更新,应用系统不断扩大规模,软件架构从单一的垂直架构慢慢演化到分布式服务架构。微服务架构即是一种分布式架构,具有去中心化、松耦合、扩展灵活等特点,如今已经被广泛应用于国内外互联网企业。在微服务环境下,服务调用量随业务增长快速增加,服务间的通信需要经受高并发和高可用的考验。要保证微服务化后的系统正常运行,就需要一套稳定高效的通信框架支持。本文在研究微服务通信相关技术的
针对现阶段金属锆或铪制备工艺的现状及存在的问题,本文提出了以钙、铝等还原剂直接还原氧化锆或氧化铪制备金属锆铪及合金的方法。该方法结合了自蔓延反应时间短、能量高和
本文共分为二章.第一章主要研究Banach空间中带有Riemann-Stieltjes型积分条件的非线性分数阶积分微分方程的解的存在性和唯一性.通过Green函数的性质、Holder不等式、Banach
陕西省地处黄河、长江两大流域之间,河流众多,水力资源丰富,水利水电工程建设能够更加合理、高效、科学的的利用水资源。然而,陕西省纬度跨越大,地质条件复杂,导致水利工程建设与运营过程中难免诱发地质灾害。因此,为科学保障水利水电工程的安全生产、运营,减少地质灾害带来了损失,为防灾减灾提供可靠的依据,开展陕西省水利水电工程地质灾害风险性评估和区划研究存在着重要的价值与意义。本文以陕西省作为研究区,对区内水
第3代合作伙伴计划3GPP启动的长期演进项目LTE(Long Term Evolution)是目前无线通信领域发展的主流技术,代表着第四代移动通信系统。与3G技术相比,LTE系统在网络架构上做了全面的改进和演化,能够保持良好的兼容性,并提供更高的峰值速率和系统容量,但是基础设施建设费用以及网络运营维护成本也随之增加。移动鲁棒性优化(Mobility Robustness Optimization,
包装作为物流的起点,对整个物流过程以及物流成本都有较大的影响,包装时所选用的配送箱对这两者的影响更为明显。就现存的配送箱来说,各主流电商平台和第三方物流配送企业对配送箱的选择和使用还不够重视,以快消品为例,据统计各主流电商平台上销售的快消品种类、品牌基本重合,但不同电商平台都有各自的一系列配送箱尺寸,即存在商品尺寸与商品配送箱尺寸不匹配的现象,以致配送箱的容积利用率不足,从而产生较高的包装成本和运
研究背景咳嗽变异性哮喘(CVA)仅表现为咳嗽,容易与其它病因的慢性咳嗽患者相混淆,在临床上很容易被忽视和误诊。由于CVA进展数年后可发展为典型哮喘,充分了解CVA的病理生理学和临床特征,早期识别CVA患者,对阻断CVA向典型哮喘转化至关重要。目前,大多数哮喘相关研究都与典型哮喘有关,CVA的病理生理学和临床特征尚未阐明。研究表明肺量计小气道功能指标中的最大呼气中期流量(MMEF)可早期识别哮喘患者
超分辨率重建技术突破遥感硬件成像条件的限制,可获得高于已知分辨率的超分辨率遥感影像,是提高遥感影像分辨率的重要手段,也是图像处理领域的热点话题。土地覆盖分类是遥感