基于网络搜索数据的游客量预测模型研究——以北京市为例

来源 :西安理工大学 | 被引量 : 0次 | 上传用户:panzhengdang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年我国旅游产业发展迅速,外出旅游已成为生活的常态,但游客普遍反映旅游体验在逐渐变差,知名景区在节假日期间人满为患、混乱嘈杂,出行难问题愈演愈烈。究其原因,主要是因为旅游高峰期景点接待能力与涌入的游客量不匹配,使得管理人员措手不及,造成景区混乱、破坏景区环境、影响城市旅游形象,甚至酿成安全事故等等。因此,如果能实现科学、精确的游客量预测,并以此为依据制定应急预案,调整景区运营管理方式,进而提高旅游安全性和服务质量,才能更好的促进旅游业持续健康发展。同时,在网络信息时代,足不出户通过网络搜索查询所需要的信息、做好事前准备工作,已经成为人们的习惯之一,因此在有关事物近期发展态势的预测研究中,网络搜索数据逐渐受到研究人员的关注与重视。本文在总结分析前人研究的基础上,采用粒度更为精细的月度数据,以北京市接待的游客量为例,探讨合适的预测方法、创新优化预测模型,以实现对游客量更为精准、及时的预测。本文主要研究内容包括以下几方面:  (1)从游客旅游行为发生过程的角度出发,构建网络搜索数据和游客量相关联的概念框架,基于文本挖掘并结合旅游六要素,获取核心关键词,并将其作为解释变量,建立初步预测模型,验证网络搜索数据与游客量之间的关联度,分析核心关键词的预测能力。  (2)为保证信息的完整性、提高预测的科学性和精确性,对核心关键词进行大范围拓展,形成初始词库,通过相关性分析和时差分析,筛选出21个高相关性的关键词并确定其时滞阶数,再基于Adaptive-Lasso方法从中选出10个最佳模型变量;为做一对比,也采取了常用的主成分分析法进行变量构造,得到3个构造变量,为模型建立做好准备。  (3)运用ELM神经网络、支持向量回归及随机森林三种机器学习算法,分别基于10个最佳变量和3个构造变量,建立多个游客量预测模型,比较分析不同模型的预测能力。结果表明运用Adaptive-Lasso法选择的最佳变量建立模型,模型的各类评价指标都更优。而三种机器学习预测模型中,支持向量回归模型最优,随机森林模型最稳定,ELM神经网络模型相对较差,但总体来说均达到了较好的预测效果。为进一步提升模型稳定性和泛化能力,本文引入组合预测法的思想展开进一步研究,结果表明变权组合模型能较为显著地提升预测准确度。  网络搜索数据;游客量预测;Adaptive-Lasso方法;机器学习算法;变权组合
其他文献
“主题意义”来自最新版的《普通高中英语课程标准(2017年版)》,以下简称为《课标》,《课标》将主题语境列为英语课程内容的六大要素之一.程晓堂认为语言离不开语篇,语篇离不
期刊
本文着力探究如何从众多的语言现象中挖掘文本蕴含的核心价值,如何探寻文本中独一无二、最为核心、最具迁移的语言形式,然后有针对性地练笔,引导学生在写作实践中掌握语言文
出错、识错、纠错是一个完整的学习过程,小学生的认知网络在逐步建立和完善,都依赖于不断地犯错和改错过程.自主订正作业,属于改错和建立正确知识网络的学习过程,为引导学生
随着创新创业形势的不断发展,培养高素质和高能力的应用型复合会计人才是新经济环境下会计学科提出的创新实践要求,也是中职财会教学发展的一个重要方向,传统的以教师为主,学
呼吸道传染病是临床中常见的传染性疾病,主要由飞沫传播,也可以通过直接或者间接接触传播,呼吸道疾病的大范围感染很容易引起民众恐慌,本文主要就呼吸道传染病的预防与控制措
随着职业教育的飞速发展,我国中职教育规模已经和高中阶段教育规模平分秋色了.“十三五”规划推介的校企合作,就是实现中职学校与企业优势互补、资源共享的双赢模式.我校文秘
理论与实践相结合的教学方法能够引导学生在学中做,在做中学,将理论应用到实践中去,从而真正掌握知识.其中科学这门课程尤其需要培养学生的实践能力,本文作者谨根据自身教学
“雪亮工程”是中央政法委、中央综治委贯彻落实习近平总书记关于建设立体化、信息化社会治安防控体系重要指示精神的一项重要举措.实现在天网工程、“平安城市”视频监控联
期刊
一、众志成城抗击疫情安防行业在行动rn新冠肺炎疫情发生后,安防行业从行业组织到企业个人,挺膺担当,发挥自身优势和专长,在一线和后方,在线上和线下,迅速投入为疫区提供相关
期刊
英语是学生基础教育阶段必须学习的课程,但是并非每个学生都能轻松地学好这门外语,在学生间普遍存在英语成绩两极分化的问题.本文分析了小学六年级成绩分化的原因,并对如何提