论文部分内容阅读
随着互联网应用的不断普及,人们的生活方式发生了巨大的变化,现在人们完全可以通过互联网购买商品、点餐吃饭、观看电影等。人们在网上进行消费之后发表对于某一产品的看法形成了大量的评论文本,从这些评论中获取消费者的情感倾向,对商家或者社会组织等制定决策有着重要意义。但是目前针对评论文本的情感分析方法只能从一个段落(或一句话)获得一种情感倾向,例如某餐厅的某条评价被标为好评,但用户并不知道是服务好还是食物好,这种方法并不能精确反映出用户真正关心的具体方面,而方面级(Aspect-level)情感分析能够从某一方面判断文本的情感倾向。基于此背景,本文对评论文本进行了方面级情感分析研究,能够挖掘出评论文本中涉及到用户关心的方面,并分析对应的情感倾向。本文的研究工作主要如下:(1)方面抽取,为了能够获取更多方面,本课题利用词性序列模板构建方面候选集合,但是集合中包含了大量语义比较相近的词,所以本课题提出了一种基于余弦相似度的近邻传播聚类算法,将相似的词进行聚类形成几个聚类类别,从而对应评论文本中的各个方面。相比于传统的聚类算法,该算法在聚类效果和时间开销上表现较好。(2)方面级情感分析,为了充分利用评论文本中的方面信息,本课题结合了方面词嵌入向量和基于注意力机制的长短期记忆模型形成了新的模型,利用该模型对评论中的各个方面进行相应的情感倾向预测,该模型在对比实验中的准确率最高。(3)系统应用,本课题利用上述算法和模型,设计并实现了一个针对产品评论的基于方面级情感分析的推荐系统。从系统需求入手,分别对系统总体和各个模块功能进行设计,并通过测试检验系统的有效性。在该系统中,消费者可以在某一类产品的属性方面选择自己最关注的方面,系统会根据消费者的选择计算产品的推荐价值,并且按照价值从高到低返回给消费者选择,这样可以节省消费者在做出购买决策之前需要阅读大量产品评论的时间。