论文部分内容阅读
随着互联网的飞速发展,网络已经成为一个便捷的信息交流平台,越来越多的人开始利用网络发布信息或发表自己的观点。其中,由旅游者贡献内容、自由评论的旅游网络社区,受到广大旅游者的普遍青睐,其评论信息也成为很多旅游者选择目的地的重要依据。如何获取和挖掘旅游社区中海量的在线评论信息,智能化的分析用户的反馈和评价,从而改进旅游产品和服务,成为旅游电子商务成功的关键之一情感分类技术便可以通过对大量评论进行正负情感分类而全面高效的挖掘评论信息。目前,已经有很多面向英文旅行评论的情感分析研究,并且取得了定的成果。作为全世界网民数量最多的中国,中文信息已经成为国际互联网上非常重要的部分,但面向中文评论的情感分析技术还有很多问题有待研究。所以,本文面向中文旅行目的地评论进行了情感分析研究。本文的中文旅行目的地评论实验数据是通过编程从携程网社区中自动抓取的。在此基础上,通过实验建立了四种情感分类器模型,包括基于逐点语义分析法的分类器和基于支持向量机、朴素贝叶斯、N元文法三种典型机器学习算法的分类器。然后,比较分析了这四种分类器对旅行目的地评论进行情感分类的效果,发现在训练集评论数量不同时,三种机器学习分类器的分类表现不尽相同。综合来看,支持向量机的表现最好,分类正确率接近90%;与机器学习分类器相比,基于语义方法的分类器分类效果并没有更好,分类正确率只略高于80%,但该方法省时省力,在实际中可能具有更强的应用价值。最后,本文基于语义方法的分类实验中提取的情感倾向词组的归类统计,从游览和娱乐、食宿和购物、交通三大方面总结分析了游客反映的旅行目的地存在的一些问题,并提出建议。另外,还探讨了基于在线评论的情感分析技术在旅游电子商务系统中的潜在应用价值。