论文部分内容阅读
随着中国国民娱乐消费水平呈现上升趋势,东盟地区凭借其丰富的旅游资源和地理优势吸引了大量的中国游客。围绕中国东盟海洋大数据平台旅游挖掘预测需求,对东盟游客量的定量研究与预测,不仅有利于东盟政府机构宏观把控旅游业发展,同时能够提前构建中国-东盟旅游业协作蓝图。现有文献对于东盟地区的旅游预测分析主要还停留在定性的理论分析,且定量研究方法集中在计量经济学和时间序列模型。近年来,人工智能和数据挖掘等技术日趋成熟,在很多领域取得显著的研究成果。因此,本文基于机器学习算法定量研究东盟游客量具有一定的理论意义和广泛的实用价值。本文在东盟地区选取了泰国、马来西亚、新加坡三个热门旅游国为研究对象。首先分析东盟游客量研究背景和国内外关于游客量预测存在的局限性,并基于游客量属性和数据选取原则,确定采集客源国(中国)人均国民生产总值、客源国人口数量,目的国(新加坡、马来西亚、泰国)人均国民生产总值、SPI(客源国CPI/目的地CPI)、客源国与目的国的汇率五个指标作为影响因子,三个国家的年度中国游客量作为预测目标值。其次,提出了基于随机森林、BP神经网络和PSO-SVR的游客量预测模型,通过实验数据拟合模型并进行游客量的预测,采用R2、MAE、MSE、MAPE指标对比分析三个模型的拟合效果和预测准确度,结果显示三个模型的拟合相关指数均在90%左右,PSO-SVR预测准确度相对比较好。针对单一预测器预测侧重点不同且预测准确度较弱问题,提出了一种基于权值分配的多预测器并联组合模型来优化游客量预测精度。通过比较游客量预测值与真实值,结果表明并联组合模型能够达到更优的预测精度。最后,在分别定量分析三个国家游客量的基础上,为了挖掘三个国家之间联动涨跌情况,提出了基于Apriori的东盟国家旅游一体化研究。实验表明新马泰三个国家之间游客量增长互相影响且存在微弱竞争,其能够为东盟旅游一体化提供数据参考。最后,将本文的研究结果应用到东盟海洋大数据平台滨海旅游模块上,多元化展示旅游数据,实现游客量预测功能,为用户提供数据服务和预测参考。