论文部分内容阅读
近些年我国旅游产业发展迅速,外出旅游已成为生活的常态,但游客普遍反映旅游体验在逐渐变差,知名景区在节假日期间人满为患、混乱嘈杂,出行难问题愈演愈烈。究其原因,主要是因为旅游高峰期景点接待能力与涌入的游客量不匹配,使得管理人员措手不及,造成景区混乱、破坏景区环境、影响城市旅游形象,甚至酿成安全事故等等。因此,如果能实现科学、精确的游客量预测,并以此为依据制定应急预案,调整景区运营管理方式,进而提高旅游安全性和服务质量,才能更好的促进旅游业持续健康发展。同时,在网络信息时代,足不出户通过网络搜索查询所需要的信息、做好事前准备工作,已经成为人们的习惯之一,因此在有关事物近期发展态势的预测研究中,网络搜索数据逐渐受到研究人员的关注与重视。本文在总结分析前人研究的基础上,采用粒度更为精细的月度数据,以北京市接待的游客量为例,探讨合适的预测方法、创新优化预测模型,以实现对游客量更为精准、及时的预测。本文主要研究内容包括以下几方面:(1)从游客旅游行为发生过程的角度出发,构建网络搜索数据和游客量相关联的概念框架,基于文本挖掘并结合旅游六要素,获取核心关键词,并将其作为解释变量,建立初步预测模型,验证网络搜索数据与游客量之间的关联度,分析核心关键词的预测能力。(2)为保证信息的完整性、提高预测的科学性和精确性,对核心关键词进行大范围拓展,形成初始词库,通过相关性分析和时差分析,筛选出21个高相关性的关键词并确定其时滞阶数,再基于Adaptive-Lasso方法从中选出10个最佳模型变量:为做一对比,也采取了常用的主成分分析法进行变量构造,得到3个构造变量,为模型建立做好准备。(3)运用ELM神经网络、支持向量回归及随机森林三种机器学习算法,分别基于10个最佳变量和3个构造变量,建立多个游客量预测模型,比较分析不同模型的预测能力。结果表明运用Adaptive-Lasso法选择的最佳变量建立模型,模型的各类评价指标都更优。而三种机器学习预测模型中,支持向量回归模型最优,随机森林模型最稳定,ELM神经网络模型相对较差,但总体来说均达到了较好的预测效果。为进一步提升模型稳定性和泛化能力,本文引入组合预测法的思想展开进一步研究,结果表明变权组合模型能较为显著地提升预测准确度。