论文部分内容阅读
Web2.0的兴起,让人们可以通过论坛,BBS,点评网等各类网络媒体发布不同形式的商品评论,由此网络成为目前人们获取商品评论的一个重要来源。商品评论包含能够影响购买者的决策的重要信息,如购买者关心的商品质量、已购买者对商品的肯定与否定的态度等,但在网络上对某个商品的评论分布广泛并且数量惊人,给购买者全面浏览造成阻碍,因此,商品评论倾向性分析成为文本倾向性分析研究新热点,如何自动识别商品评论并且从中获取有价值的内容,成为了急待解决的问题。商品评论倾向性分析包括两个任务:一是商品评论中评论对象的抽取;二是商品评论情感倾向性分析,包括观点句的识别及其情感极性判断。本文主要针对网络中文商品评论的上述两个任务进行了深入的研究。在评论对象的抽取任务中,提出了中文商品评论本体的构建流程,深入分析了该本体中概念间的语义关系,初步构建了一个手机领域的中文商品评论本体;同时,在该本体中定义了一些SWRL规则用于识别隐性评论对象;采用了CRFs模型进行显性评论对象的抽取,尝试将评论对象的本体特征以及情感特征添加到该模型的特征集中,本文针对COAE2011任务3提供的digital领域的语料进行了测试,实验结果中召回率达到了83%以上,验证了上述方法是有效的。在商品评论的情感倾向性分析任务中,从句子级的角度,提出了以HowNet情感词表为种子评价词,采用基于CRFs模型的半监督迭代获取大量评价词,根据句子中是否存在评价词识别观点句,然后依据中文词间的语义规则判断句子的情感极性,并且深入研究了否定词和连词对句子情感极性判断的影响。本文将该方法参加了COAE2011任务2中文观点句的抽取的评测,在digital领域的任务评测中取得较好的成绩,其中评测结果的准确率达到了0.5839,召回率达到了0.55859,F值达到了0.576245。