机票价格预测技术的研究与实现

来源 :中国民航大学 | 被引量 : 0次 | 上传用户:liuyongqing0820
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着民航事业的快速发展,越来越多的旅客将航空运输作为远程出行的首选。而网络技术的飞速发展以及电子客票全面推广使用,各大航空公司都已利用各自的网站开始销售电子客票,人们可以从Internet上快速便捷的获取机票价格信息。面对频繁变化的机票价格,人们渴望知道机票的变化规律及何时购买机票最划算。本文基于国内航线机票数据利用数据挖掘的算法建立模型,旨在给旅客提供按出行日期预测的机票价格及购买机票的建议。本文以国内某一航班为研究对象,从数据挖掘的角度进行探究。主要研究工作如下:一、机票数据采集,通过利用垂直搜索引擎HERTRIX工具获取网站的机票价格,利用HTMLParser工具实现机票价格数据的在线获取;二、简述机票数据分析和预处理过程,将抓取到的数据进行预处理,统一标准化格式,存入数据库,并分析机票各个属性与价格的关系;三、在详细研究KNN、Q学习和加权移动平均时间序列分析算法基本原理的基础上,改进了Q学习和时间序列算法,首先KNN算法用于训练购买决策分类器,给用户一个购买建议;其次通过改进Q学习算法建立机票价格预测模型,运用历史数据不断训练Q矩阵,呈现给用户预测价格;最后运用改进的加权移动平均时间序列分析法建立机票预测模型,该模型分为小于一个星期和大于一个星期两种情况,根据预测时间与当前时间的时间差给用户呈现预测价格;四、主观Bayes算法的集成学习模型,利用Bayes推理技术将三种机票价格预测模型的预测结果进行融合,得到集成的机票预测价格和最终的购买建议。将上述数据获取技术、价格预测技术和集成算法结合,本文设计了机票价格预测原型系统。本文使用已抓取的深圳至北京的航班号为CA1304的9336条航班机票数据,分别用KNN算法、Q学习算法、时间序列算法和主观Bayes集成算法进行预测。通过模拟实验,主观Bayes集成算法很好的实现了节省开支,其效果优于其他三种算法。
其他文献
<正>自2007年起,中远海运慈善基金会在云南省临沧市实施基础教育援助项目,至2017年已累计实施十一期,累计援助资金近2000万元,用于购置课桌椅等基础教育设施6万余套,项目学校
中职数学课的开课是课堂教学的一个重要环节,开课的设计组织优化对于提高课堂教学效果具有重要作用。中职数学课开课时应遵循一定原则。常见的开课方式有情境问题、设置悬疑
根据收集的数据,分析广西水产品冷链物流行业现状,指出其存在的问题。在分析广西水产品冷链物流及其影响因素的基础上,建立影响指标体系,利用熵权灰色关联法,给各因素赋权,权
历史热带气旋记录时间序列较短空间差异大,热带气旋灾害风险评估经常面临样本不足,特别是超强台风及巨灾记录历史样本的问题,从而导致传统概率统计方法失效。过去20多年来,逐
沥青混合料拌合站在沥青路面施工中尤为重要,其运行的高效性、布局的合理性、管理的先进性对公路建设起着至关重要的作用。目前国内沥青混合料拌合站的建设布局仍然依赖于经
伴随航空业和电子商务的快速发展,飞机越来越普遍的当做出行的重要交通工具之一。然而,航空公司为获取利益最大化,通常利用私有数据采用动态定价策略进行预售机票定价,对于消
针对电子商务中的商品评论信息过载问题,运用情感计算理论,通过挖掘商品评论信息中的商品特征及相应的情感褒贬态度,为消费者提供一个商品特征粒度上的情感分析结果,从而帮助
西方法治文化是将民主理念实践化、操作化的重要保障。对法治文化可以进行多维度、多层面的讨论,本文试图揭橥西方法治文化价值的哲学观念内核。哲学是文化的内核,自然亦是法
我国在线旅行服务规模扩大,新型商业模式涌现,消费者的需求和新技术的双重推动下,商业模式的研究与实践应用受到广泛关注。管理学家德鲁克曾说过,当今企业之间的竞争不是产品
综合分析了土地利用与土地覆盖变化(LUCC)对全球气候影响研究的重要科学问题和国内外研究现状,在此基础上,考虑各学科的相互交叉、渗透和耦合等特点,提出并初步设计了土地利