基于微博大数据与机器学习算法的旅游景点推荐方法研究

来源 :江西师范大学 | 被引量 : 0次 | 上传用户:feifeifo123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
旅游景点的精准推荐有利于提升用户出行的效率与旅游体验。然而,旅游特征因子的选择与推荐算法的不同都会影响景点推荐的准确性。针对现有旅游推荐研究中存在数据稀疏、旅游因子不足、推荐准确率不高等问题,本文利用微博数据的个性化表达、现势性强等特性以及机器学习的智能化预测作用,提出了基于微博数据与机器学习的景点推荐方法,实现了精准化、个性化的旅游景点推荐。论文的主要工作及成果体现在:(1)微博数据具有数据量大、语义丰富、表达用户真实思想、易获取等特点,可以缓解传统的利用旅游网站数据进行旅游推荐的数据稀疏性问题。因此,本文首先利用Python爬虫获取了与景点相关的新浪微博数据,并对获取的数据进行分类与清洗,以用于旅游景点的推荐研究。(2)其次,本文提取了丰富的旅游特征因子。典型的旅游推荐算法从景点、游客等方面选择旅游特征因子,未考虑游客到访目的地的通行时长、旅游季节等上下文信息,而它们可以从不同角度帮助了解用户的旅游偏好。本文从旅游景点角度利用核密度估计等方法提取了景点位置、景点票价、景点级别、主类、亚类、基本类型六个特征因子;从游客角度利用统计分析等方法提取了性别、年龄、年龄段、客源地四个特征因子;从上下文感知信息角度利用地理集中指数等方法提取了通行时长、季节、月份三个特征因子。基于此建立了丰富的旅游特征因子库,并将多元特征进行组合,为可靠预测提供支撑。(3)再次,针对协同过滤推荐算法的数据稀疏、冷启动问题,本文引入机器学习算法,并结合已提出的多特征旅游因子来构建动态的景点预测(随机森林偏好景点预测(Random Forest Preferred Attraction Prediction,RFPAP)和神经网络偏好景点预测(Neural Networks Preferred Attraction Prediction,NNPAP))模型。实验结果表明,RFPAP和NNPAP方法能够克服数据稀疏性问题,分别取得了89.61%和89.51%的准确率,且RFPAP方法优于NNPAP方法,具有更强的泛化能力。(4)然后,本文采用FP-Growth算法构建景点关联(FP景点关联(FP-Growth Attraction Association,FP-Growth AA))模型。利用该模型可以高效地挖掘微博数据中景点之间的关联规则。实验结果表明,通过挖掘游客选择的景点之间的关联关系,可为旅游出行决策提供有效信息。(5)最后,提出了一种融合RFPAP与FP-Growth AA模型的旅游景点推荐方法,不仅可以预测游客偏好景点,而且可以挖掘出与偏好景点关联性强的景点集,并依据置信度排序推荐给目标游客,有效提高了景点的个性化推荐精度,具有很强的泛化能力。
其他文献
从展示知青生活的《迷夜》,到绘制城市地图的《繁花》,金宇澄对过去时光的回望与书写,总是带有某种强烈的“破碎”意味。这种交织着复杂内涵的“破碎”意绪,不仅构成了金宇澄
针对群居蜘蛛优化(SSO)算法求解复杂多峰函数成功率不高和收敛精度低的问题,提出了一种自适应多种群回溯群居蜘蛛优化(AMBSSO)算法。引入自适应决策半径概念,动态地将蜘蛛种群分成
针对红莲山水库除险加固初步设计问题,介绍了红莲山水库的水文情况和红莲山水库的工程地质情况,探讨了红莲山水库大坝除险加固设计、红莲山水库大坝坝身防渗除险加固方案,主
世界各国因生活环境、宗教信仰、传统习俗、生活方式、价值观念和审美意识等的不同,逐渐形成了文化差异,这种文化差异无不都反映在文学作品中,因而文学作品中出现了大量“文化负载词”,这些文化负载词在文化传递中起重要作用。那么,在文学作品翻译过程中如何传递这种文化差异便成为了重点,而文化负载词的翻译更是难点。《挪威的森林》这部小说作为日本现代作家村上春树的最畅销作品之一,迄今为止,在日本的发行量已达到200
新疆古称西域,地处中国西北边陲,环接数国。早在两汉时期,新疆就已被纳入中国疆域版图。1884年新疆建省后,采取与内地一体化的治理方略。及至民国,新疆政权落入地方军阀之手,
<正>兰州石化公司党委认真贯彻落实党中央和集团公司党组全面从严治党各项部署要求,坚持思想建党与制度治党相结合,把党委理论学习中心组(简称党委中心组)学习作为两级党委领
《医宗必读》是一部综合性医学著作,其中收录了400多味本草和600多首方剂,里面记载了丰富的中药炮制方法和炮制理论。该书在一定程度上反映了明代的中药炮制技术水平,对研究
会议
信息经济学理论表明价格并不能囊括全部的市场经济关系,信息的搜寻需要成本,而个人决策者因此必定不能考虑到所有信息并作出最优决策,在股票市场亦如此。行为金融学表明投资
利用密度泛函理论,在B3LYP/6-31+G(d,p)基组水平上对苯酚-水团簇C6H5OH(H2O)n(n=1-6)的可能构型进行全优化,得到了团簇的稳定结构;在B3LYP/6-311++G(d,p)基组水平上计算得到了各团簇
航空结构件多为弱刚度薄板件,其不仅在加工成型过程中难以保证较高的尺寸精度,而且在装配时会引起装配体的回弹变形,这导致了最终装配体尺寸偏差的产生。装配偏差建模与分析