论文部分内容阅读
伴随着中国旅游行业的蓬勃发展,民宿行业在近十几年得到了快速扩张,民宿的数量不断攀升,一方面给民宿带来了经营压力,另一方面也使测评民宿满意度的难度增大,互联网以及移动互联网的普及使得在线点评数量呈现爆炸式增长,大数据时代的提出使企业将目光投在了客观的数据上,客观数据可以更加科学、真实地反应民宿的满意度情况,为民宿管理者的决策提供重要依据与指导。经调研,我们发现目前对于民宿满意度的研究已经建立了一定的基础,但是对全国范围内的民宿开展调查的研究数量是非常少的。除此之外,对于民宿的满意度研究所采用的的方法也大都集中在问卷调查法,利用文本挖掘技术直观感受民宿消费者的态度的方法仍在少数。综上,本文充分利用在线点评网站上的点评信息,将其与民宿满意度测评结合起来,利用文本挖掘的方法对民宿的满意度进行了研究。主要的研究工作和相关结论有以下四个方面:第一,利用Gooseeker软件的网络爬虫技术对携程网民宿的评论内容定义了爬取规则和路线,爬取了样本数据。第二,对以上得到的样本数据进行可视化分析和LDA主题模型分析,主要利用R语言软件和ROST CM软件。其中可视化分析主要从词云图和语义网络两方面出发,得到了消费者最为关注的几个方面,分别为“服务”“房间”“环境”等词。基于LDA主题模型分析的特征分析总结了前8个主题词,通过分季度的LDA主题模型分析结果,可以看出主题随时间的变化情况。第三,民宿满意度的分析是基于情感词典对评论内容进行情感分析,利用Python软件计算出每条评论数据的情感值,通过情感值的正负和绝对值的大小定义民宿的满意程度。通过描述性分析可知,正面积极的情感占70.6%,负面消极的情感占19.8%,在正面积极的情感得分中,评分在10分至20分的占比最多,在负面消极的情感得分中-10分至0分的占比最多。第四,利用层次聚类的方法研究民宿的影响因素,得到了五个类别,分别为客房硬件、总体服务、餐饮、地理位置和性价比。计算出了每个影响因素的情感倾向,并利用列联表分析了五个类别与情感倾向之间具有相关关系。通过研究发现总体服务的满意度最高,高达82.7%,可见民宿在服务方面基本表现较好;负面消极产生最多是客房硬件,占比为33.6%,餐饮的负面消极表现也较强烈,占比为27.2%,可见消费者对于客房的硬件设施和餐饮方面的满意程度较低。同时也用列联表分析了不同地区和不同季节与情感倾向之间具有相关关系,得到了东北地区的民宿满意度最高,夏季的民宿满意度较高的结论。最后,将理论与实际相结合提出建议,本文从加强硬件设备、提高总体服务水平、提高餐饮水平、淡化淡旺季影响、重视大数据营销以及加强地区民俗文化的渲染这六个方面提出了提高顾客满意度的对策和建议。