论文部分内容阅读
随着信息技术的迅速发展,Inernet为人们带来丰富的信息资源的同时,在很大程度上也改变了信息的发布及获取方式。网络产品评论对企业和消费者都将具有十分重要的意义。它不仅可以使企业能够了解客户对企业及产品的情感倾向分布,为企业提供重要的商务决策信息;而且对消费者的购买决策也具有重要影响。然而,由于产品评论数量急剧增加,并且具有非结构化特征,通过人工的方式难以准确挖掘产品评论信息。如何采用自动分析方法充分挖掘网络评论中的客户情感信息,已成为网络信息管理领域的研究热点。
本文借助自然语言处理技术、数据挖掘、机器学习、信息检索等领域的理论与方法,针对传统的评价关联对识别方法中存在覆盖率低、句子结构简单以及无法解决指代消解等问题,围绕产品评论情感倾向性分析中的评价关联对识别问题展开了研究,提出了基于条件随机场的产品评论评价关联对的自动识别方法。首先,建立了产品评论评价关联对识别的条件随机场模型,将评价关联对的识别问题转化为条件随机场模型的序列标注问题,并且提出了评价关联对识别的条件随机场模型标注方法。其次,本文提出了基于词信息、词性信息、位置信息、语义信息、短语结构信息、句法依存关系信息的评价关联对识别的条件随机场模型的特征构造方法,并构造基于上述六类信息的评价关联对识别条件随机场模型的特征模板。然后,对基于条件随机场的评价关联对识别系统进行了设计,构建了评价关联对识别系统结构,并结合系统的各个处理模块详细地设计了使用本文提出的方法进行评价关联对识别的全过程,包括识别过程中具体的处理方法。最后,本文基于不同复合特征模板的关联对识别方法进行了对比实验。实验结果表明,本文所提出的评价关联对识别方法有效地选取了影响评价关联对识别的六类信息,与前人所提出的方法相比,可以获得更好的评价关联对识别效果,提高关联对识别的准确率。