基于网络搜索数据的游客量预测模型研究

来源 :西安理工大学 | 被引量 : 0次 | 上传用户:stystill
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年我国旅游产业发展迅速,外出旅游已成为生活的常态,但游客普遍反映旅游体验在逐渐变差,知名景区在节假日期间人满为患、混乱嘈杂,出行难问题愈演愈烈。究其原因,主要是因为旅游高峰期景点接待能力与涌入的游客量不匹配,使得管理人员措手不及,造成景区混乱、破坏景区环境、影响城市旅游形象,甚至酿成安全事故等等。因此,如果能实现科学、精确的游客量预测,并以此为依据制定应急预案,调整景区运营管理方式,进而提高旅游安全性和服务质量,才能更好的促进旅游业持续健康发展。同时,在网络信息时代,足不出户通过网络搜索查询所需要的信息、做好事前准备工作,已经成为人们的习惯之一,因此在有关事物近期发展态势的预测研究中,网络搜索数据逐渐受到研究人员的关注与重视。本文在总结分析前人研究的基础上,采用粒度更为精细的月度数据,以北京市接待的游客量为例,探讨合适的预测方法、创新优化预测模型,以实现对游客量更为精准、及时的预测。本文主要研究内容包括以下几方面:(1)从游客旅游行为发生过程的角度出发,构建网络搜索数据和游客量相关联的概念框架,基于文本挖掘并结合旅游六要素,获取核心关键词,并将其作为解释变量,建立初步预测模型,验证网络搜索数据与游客量之间的关联度,分析核心关键词的预测能力。(2)为保证信息的完整性、提高预测的科学性和精确性,对核心关键词进行大范围拓展,形成初始词库,通过相关性分析和时差分析,筛选出21个高相关性的关键词并确定其时滞阶数,再基于Adaptive-Lasso方法从中选出10个最佳模型变量:为做一对比,也采取了常用的主成分分析法进行变量构造,得到3个构造变量,为模型建立做好准备。(3)运用ELM神经网络、支持向量回归及随机森林三种机器学习算法,分别基于10个最佳变量和3个构造变量,建立多个游客量预测模型,比较分析不同模型的预测能力。结果表明运用Adaptive-Lasso法选择的最佳变量建立模型,模型的各类评价指标都更优。而三种机器学习预测模型中,支持向量回归模型最优,随机森林模型最稳定,ELM神经网络模型相对较差,但总体来说均达到了较好的预测效果。为进一步提升模型稳定性和泛化能力,本文引入组合预测法的思想展开进一步研究,结果表明变权组合模型能较为显著地提升预测准确度。
其他文献
<正>UNStudio于2014年完成了其首个中国项目,自此UNStudio开始了中国的建筑之旅。至今,在中国,事务所已完成10个项目(包括中国港澳台地区),还有多个项目即将竣工。在一系列的
本文针对压力容器及管道受裂纹危害造成的大量破坏现象,基于断裂理论对裂纹扩展问题进行研究,以期更好地把握裂纹扩展中应力场的分布变化。本文所做主要工作如下:(1)对裂纹问
课堂心理气氛能极大地影响课堂教学的效率和效果.课堂心理气氛主要由教师创设,教师的心理状态、教师与学生的关系、教学内容是影响课堂心理气氛的主要因素,也是创造良好课堂
北京2011年11月7日电/美通社亚洲/——日前,德州仪器(TI)宣布推出适用于能量采集的新一代电源管理集成电路(IC)。支持纳米(超低)级电能采集的高效率升压充电器不但可管理太阳能、热电
介绍了以单片机为核心的混凝土称重配料系统,可对多种物料进行精确称重配料。对系统的控制策略进行了研究,提出了对系统误差的处理方法,有效提高了系统的称量精度,并进行切实
<正>UED:通常你们设计的切入点是什么,又会怎样来推进这些项目?UNStudio:设计的切入点一般是基于一个我们长期构想描绘的宏远蓝图。也可以说当我们着手接触一个新项目时,并不
根据联合国艾滋病规划署和世界卫生组织共同发布的《2006年世界艾滋病报告》,2006年全球新增艾滋病病毒感染者430万,使得艾滋病病毒感染者总数达3950万;同时,全球又有290万人死于
语言学习的关键在于学过会用,但我国英语学习者的语言表达能力却一直不尽如人意。以说写同步发展为导向的英语读后写话教学模式或可为解决这一问题提供一种思路。本文从读后
自20世纪90年代以来,面对国际、国内形势的深刻变化,印度不失时机地加速向大国迈进.发展经济、扩充军备、开展全方位外交,是其重要举措.印在迈向大国的途中,一直将中国视为防
小产权房是一个全国热议的话题,针对小产权房问题各家学者观点纷呈。与其说小产权问题首先涉及法律问题,不如说首先涉及利益分配的问题,处理小产权房问题,也就是对整个社会资