论文部分内容阅读
商品评价的识别及倾向性分析近年来已成为自然语言处理领域的热点研究问题。相对于一般的商品评价,商品细粒度评价能够更细致、准确地反映出顾客购买商品的心得。这些信息一方面可为顾客购买商品提供参考;另一方面可为商家改善商品品质,提高销售服务质量为增强行业竞争力提供依据。商品细粒度评价的识别与分析的目标是对评价信息中所涉及评价对象的各个侧面进行情感极性判别,进而准确反映用户的商品评价意图,因此具有更高的实用性。本文工作分为两个阶段:情感对象与情感词的同步识别阶以及在此基础上的倾向性分析阶段。在商品细粒度评价的识别阶段,本文将句法关系信息、情感要素信息及聚类代码信息引入条件随机场模型中,在满足了情感对象和情感词同步抽取的基础上,在3类不同领域的数据集上进行实验,其中F1值分别达到了94.16%、91.44%、91.41%,在混合商品评价数据集上的实验结果显示,准确率为95.43%、召回率为91.61%、F1值为93.48%,实验结果充分说明了本方法的有效性。在商品细粒度评价的倾向性分析阶段,为解决HowNet的情感知识库中情感词汇不足的问题,采用PMI算法对其进行扩充,同时考虑到情感要素词对的倾向性并不完全依赖于情感词的极性,把否定信息以及情感词极性与情感要素词对极性的关系引入到支持向量机。在商品细粒度评价的双极性分析实验方面,混合数据的准确率达到98.15%,在单极性分析实验方面,混合数据中的正负评价的F1值分别为98.96%、91.69%,一方面证明了该方法的合理性,另一方面说明了不同极性在倾向性分析任务中处理方式的差别。最后设计实现了商品细粒度评价倾向性分析系统,该系统对用户输入的商品评价信息进行要素抽取,得到情感对象和情感词的匹配结果,而后对其做倾向性分析并通过系统界面展现给用户。