面向评论文本的方面级情感分析技术研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:qncy1232f
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网应用的不断普及,人们的生活方式发生了巨大的变化,现在人们完全可以通过互联网购买商品、点餐吃饭、观看电影等。人们在网上进行消费之后发表对于某一产品的看法形成了大量的评论文本,从这些评论中获取消费者的情感倾向,对商家或者社会组织等制定决策有着重要意义。但是目前针对评论文本的情感分析方法只能从一个段落(或一句话)获得一种情感倾向,例如某餐厅的某条评价被标为好评,但用户并不知道是服务好还是食物好,这种方法并不能精确反映出用户真正关心的具体方面,而方面级(Aspect-level)情感分析能够从某一方面判断文本的情感倾向。基于此背景,本文对评论文本进行了方面级情感分析研究,能够挖掘出评论文本中涉及到用户关心的方面,并分析对应的情感倾向。本文的研究工作主要如下:(1)方面抽取,为了能够获取更多方面,本课题利用词性序列模板构建方面候选集合,但是集合中包含了大量语义比较相近的词,所以本课题提出了一种基于余弦相似度的近邻传播聚类算法,将相似的词进行聚类形成几个聚类类别,从而对应评论文本中的各个方面。相比于传统的聚类算法,该算法在聚类效果和时间开销上表现较好。(2)方面级情感分析,为了充分利用评论文本中的方面信息,本课题结合了方面词嵌入向量和基于注意力机制的长短期记忆模型形成了新的模型,利用该模型对评论中的各个方面进行相应的情感倾向预测,该模型在对比实验中的准确率最高。(3)系统应用,本课题利用上述算法和模型,设计并实现了一个针对产品评论的基于方面级情感分析的推荐系统。从系统需求入手,分别对系统总体和各个模块功能进行设计,并通过测试检验系统的有效性。在该系统中,消费者可以在某一类产品的属性方面选择自己最关注的方面,系统会根据消费者的选择计算产品的推荐价值,并且按照价值从高到低返回给消费者选择,这样可以节省消费者在做出购买决策之前需要阅读大量产品评论的时间。
其他文献
人口(亿人)农业劳动力(万人)耕地(亿英亩)谷物年产量(亿吨) 最高纪录 1981年谷物单位(吨/公顷) 1950年 1982年使用化肥(营养含量:万吨/年)年种子消耗(万吨)产量种子比肉类年
920217 Protective action of biphenyldimethyl diearboxylate(DDB) against livernuclear DNA damage induced by carci-nogens.QING Weiguo (青卫国,LIU Gngtao (刘耕陶).
政治干部依法指导和开展政治工作能力强不强,直接关系到政治工作法规制度落实的质量和效果,要切实形成党委依法决策、领导依法办事、机关依法指导、基层依法建设的良好局面,
【正】 无毒棉也称作无棉毒素棉或无腺体棉。一般棉花品种,在棉籽仁的子叶和胚轴上布满红褐色的色素腺,色素腺中含有棉酚(即棉毒素),其分子式为C<sub>30</sub>H<sub>30</sub>O<
以2008年五起有代表性的群体性事件为例,分析群众的维权方式,在此基础上探讨抗议群众之所以采取不同维权方式的原因:一是经济发展水平不同;二是政府的管治能力有差异;三是维权
本文从管理的角度提出机械论的理论观点并详细分析了机械论在管理实践中的表现形式。随着时代的发展,笔者提出管理者应该坚持以人为本的管理思想并在管理实践中把这种以人为本
【正】 甜高梁又名甜芦粟,一亩地一般可产茎秆4,000—6,000斤,产籽粒300—500斤。茎秆含糖量18%左右,高的可达21—22%。很早以前,我国人民就把它当作生食“水果”。近年来,不少
【正】 一、发展葡萄生产的意义 葡萄是世界上重要的浆果类果树,也是世界上果树栽培面积最大的一种。据联合国粮农组织统计,1976年世界葡萄栽培面积达15,624万亩。1978—1980