论文部分内容阅读
人们在网络上购买商品后,习惯于在商家提供的平台上留下对产品优劣的评价。潜在的消费者可以通过产品评论了解产品信息来决定自己的选择,商家也可以根据评论来学习别人的优点改正自己的不足。其中,评论中的情感词对于分析评论的态度具有决定性作用,而情感词所描述的特征词则反映了用户关注的焦点。因此产品评论挖掘的主要任务之一就是挖掘评论中的情感词与特征词。本文所做工作主要有如下几个方面:给出了一种对评论进行规范化和切分的预处理方法。对评论的格式进行规范和统一,之后将评论切分成短句。通过对评论的预处理有助于文本处理工具对评论取得更好的处理效果。在挖掘情感词时,考虑到情感词和特征词在词性组合上的搭配模式,给出了基于词性模板的情感词挖掘方法。该方法从种子评论集中提取匹配情感词的词性模板,应用模板对情感词进行挖掘,随后通过停用词集和依存关系对挖掘结果进行双重剪枝。最后的挖掘结果既包含评价产品显性特征的情感词,也包含评价产品整体和隐性特征的情感词。在挖掘特征词时,给出了基于情感词的特征词挖掘方法。通过评论中情感词的位置,定位特征词所在的句子片段。通过词性搭配与句法结构相融合的方式,对特征词进行自动匹配,达到特征词与情感词的对应。匹配的结果在识别高频特征词的同时,对低频特征词也可较好识别。实验结果表明,应用本文给出的产品评论挖掘方法能够取得较好的挖掘效果。