基于数据挖掘的桂林市游客满意度分析

来源 :广西师范大学 | 被引量 : 5次 | 上传用户:whansiyu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络时代的发展,很多游客热衷于在网络平台上发表外出旅游的体验和评价。从而产生了海量的关于游客网络评论的数据,而旅游网站和相关部门要想提升经营效益和改善旅游环境,就必须从中挖掘出有用数据信息。本文利用数据挖掘的技术对携程旅行网上桂林市游客网络评论进行研究,主要研究工作及相关的结论如下:第一,使用基于八爪鱼采集器的网络爬虫技术研究了携程旅行网官网上的游客评论数据的抓取规则和采集规则,采集了该网站上的1260条评论并以Excel格式导出,再对原始数据集进行去除无效评论的预处理,最后得到1210条,近10万字的游客网络评论作为样本数据集。第二,使用可视化技术和LDA主题模型对采集的游客评论文本数据进行特征分析。通过词云图直观准确的找到高频词,并结合分类方法来确定影响游客满意度的影响因素;再根据网络语义直观的给出了高频词间的语义关系网。最后利用LDA主题模型对文本数据集进行主题提取,得到了游客关注的前8个主题为:行程、景点、酒店、导游、吃饭、购物、讲解和服务。第三,构建适合本文研究需要的情感词典,并基于情感词典进行情感分析,利用Python编程计算了所有游客评论的情感值,发现有33.64%的游客具有较高的忠诚度。第四,先对网络采集的文本数据进行量化,再利用相关分析、回归分析的统计方法对游客评论数据进行分析,并建立模型。接着我们对不同年度、月度的游客评论数据进行了比较分析。最后,对上面的研究结果进行了总结,并向桂林市旅游相关部门和相关旅游网站提出了意见和建议,以期给其提供参考。
其他文献
提出了基于预测的洗涤过程优化与控制一体化策略方法,该方法的控制级策略采用递推广义预测自校正控制器(RGPC)减少了现有广义预测控制(GPC)算法在线计算量,同时采用多步预测信息的优化级目
对企业过程控制网、生产管理网、信息管理网的结构、硬件及接口配置进行初步探讨和改进,并介绍了应用情况。
讨论目前几种典型现场总线的特性,重点是现场总线的核心--数据链路层。对各种现场总线在不同通讯类型(周期性通通讯、非周期性通讯…)以下的性能比较和分析,帮助工程人员选择适合系
2011年12月22日,中共苏州市委十一届二次全体(扩大)会议召开,这次全会确定了2012年的工作总思路,谋划部署了2012年的工作任务和工作目标,为苏州率先基本实现现代化奠定了总基调。
通过分析分布式数据库与实时数据库的特点,提出了一种把二者结合起来的数据库技术,并采用SQL Server作为软件平台,讨论了基于SQL Server的分布式过程实时数据库的软件设计,进一步研究了此软件在实
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
为了建立准确的阻尼器出力模型,在Bingham黏塑性模型的基础上增加线性弹簧单元描述磁流变液的黏弹塑性.以双出杆剪切阀式磁流变阻尼器为研究对象,将上述模型引入多场耦合仿真
近年来,国内外各种类型的除铁设备基本上可以适应各种不同使用场合的要求。们申力和愎诺等皮带输送系统中目前普遍使用的电磁式除铁设备,因其连续工作,励磁线圈中一直通有直流电
农业生产中由于化肥农药的过度使用,导致生态环境污染、种植地土壤板结退化、农产品农药残留高、产品质量下降等问题日渐严重,选择高效安全的生防菌剂取代化学防治可以很好地解决上述问题。木霉属(Trichoderma spp.)真菌具有极强大的分泌生物防治活性物质能力,能够拮抗多种植物病原真菌,已被广泛应用于农业生物防控。然而,木霉菌发挥生防作用的分子机制尚未明确,这极大地限制了木霉菌的工业化发展。随着木霉
提出用三个差压变送器来监测储油罐的液位、油水界位、原油密度、原油库存等参数 ,具有成本低、精度高、容易实现自动化等特点。