论文部分内容阅读
互联网的深入发展改变了消费者的行为习惯,线上消费与用户评论成为消费者的普遍行为。线上用户评论海量增长,用户通过评论表达对事物的看法和自身的情感,这为自然语言处理的发展提供了肥沃的土壤。随着自然语言处理的不断发展,评论挖掘技术日益成熟。为挖掘用户评论情感,明确用户消费侧重点,亟需对用户在线评论进行分析与挖掘。用户在线评论涉及领域全面,覆盖面广,其中旅游领域较为特殊,不同于其他有形产品,旅游属于服务产品。尤其是邮轮旅游,消费群体小,面向中高端人群,其用户评价通过调查法等原始方法较难获取,故其用户线上评价就显得弥足珍贵。因此,本文梳理在线评论挖掘方法,构建了在线评论挖掘模型,并将其应用于邮轮旅游领域,以明确邮轮旅游领域用户评价情感,在理论方法和应用实践方面都有重要意义。本文基于领域本体构建邮轮旅游在线评论挖掘模型,首先进行领域本体的构建以明确研究领域范围,并提高最终情感分析结果的准确率。采用七步法构建领域本体,确定领域范畴和复用可能性、明确领域概念词和术语、定义类及层次结构、定义属性及其分面和确定实例,最终得到领域本体层级结构图以及类和实例。其次进行情感词典的构建,情感词典分为三个部分,分别是基础情感词典、领域情感词典和补充情感词典。基础情感词典采用现有并较为常用的知网情感词典,领域情感词典采用SO-PMI算法扩展情感词,得到具有针对性的领域情感词,而补充情感词典主要考虑否定情感词、程度副词及表情符号对用户评价情感的影响。最后进行用户评论的情感计算,运用算法计算用户评论的整体情感,并结合CountVectorizer与LDA提取用户评论的特征词,结合领域本体的类和实例确定最终的特征词以明确情感计算的主要对象。最终得到准确率较高的基于领域本体的邮轮旅游在线评论挖掘模型。并运用该模型对邮轮旅游领域进行实验,明确了该模型有较高的准确率。本研究成功构建在线评论挖掘模型并对邮轮旅游领域用户评论进行情感计算和分析,最终得到以下研究结论:在理论层面,采用基于领域本体的在线评论挖掘模型能够较为精确的计算出在线评论情感。在邮轮旅游领域中验证,其准确率达到90.3%,证明了该方法具有可行性。在实践层面,将该模型应用于邮轮旅游领域,实验结果表明:(1)邮轮旅游市场用户对邮轮旅游多为正向评价,且对邮轮住宿方面评价最好,邮轮餐饮方面评价最差。(2)邮轮旅游市场“马太效应”和“二八定律”显著。(3)邮轮品牌定位清晰,用户涵盖广阔,但销售渠道较为单一。