论文部分内容阅读
随着影视网站逐渐渗入人们的生活,越来越多的用户在浏览观看电影的内容后会留下自己的评论,包括对内容或是某一方面的观点看法和情绪态度。针对电影各方面的评论已经成为一种重要的信息载体,根据中文评论自身的语义特征,例如词性和程度词的组合等特征,利用自然语言处理领域中的各种算法和模型对电影评论进行情感分析,获得潜在情感的研究是十分必要的。对投资者而言,电影评论已经成为进行情报分析的重要数据来源,投资者可以从中了解观众的关注点和情感特征等关键信息,进一步确定投资趋势或处理方法,满足市场和观众的需求;对观众而言,电影评论显著地影响着观众自身以及其他观众的选择和决策,针对电影进行评论是在决策过程中帮助其他用户获取相关意见的一种快速方式。针对网络平台上的电影评论进行研究处理并分析总结,可以帮助投资者和观众更快速、更有效地达到自己的目的。因此,本文着眼于电影评论,分析评论的语义规则,结合中文语义特征和语序关系,构造层次条件随机场模型和有向网络图模型完成对电影评论的情感分类研究。(1)基于条件随机场模型的电影评论情感分类研究。在机器学习方法中条件随机场模型具有良好的分类性能,同时能有效地融合多种类型的特征,将中文独特的语义规则转化为语义特征融入到条件随机场模型中能更准确地进行情感分类。本文为解决单层条件随机场模型对电影评论的情感极性和强度分类准确率较低的问题,提出构建三层条件随机场模型,按照层次逐层完成电影评论的主观句和客观句分类、正面评论和负面评论的情感极性分类和一般强度评论和强烈强度评论的情感强度分类。对电影评论进行情感分类时,在原有的语义特征的基础上进一步考虑了转折连词以及递进连词对情感极性分类和强度分类结果的影响,使分类特征及特征模板更加全面可靠。结合贝叶斯分类器和支持向量机分类器的分类优势,纠正单个分类器可能产生的错误,进一步提高分类的准确性。这样层层递进的分类方式与传统的单层条件随机场相比,通过层次模型每一层有效的特征以及特征模板向下一层的传递,可以达到减少分类误差,提高整体分类精度的目的。与传统的分类算法相比,更加全面地考虑中文独特的语义特点,将程度词、否定词等语义特征融合在情感分类模型中,使模型的性能更加优良。(2)融合有序关系的电影评论情感分类研究。针对传统研究中缺少句法分析和忽略语序规则的问题,本文利用条件随机场模型选择的评价词、程度词和否定词等语义特征及模板组合并融合有序关系,提出一种构造有向网络图模型进行电影评论的情感分类方法,通过有向网络中节点与节点的指向关系对应于电影评论中词语的语序关系,进一步研究融合有序关系的语义特征对情感分类的影响程度。根据分析得到Q模式、WQ模式、NQ模式、NWQ模式、WNQ模式这五种语义结构,结合韦伯-费希纳定律将用户心理感受量转化为物理定量,利用评论情感相似性计算方法更好的确定评论的情感极性和强度类别。与传统的分类方法进行情感分类研究相比,结合语义结构并构造电影评论有向网络图可以充分表现出中文词汇语序对情感分类结果的重要作用,以及语义结构的不同模式对情感强度的偏移程度,在评论情感相似性计算时考虑情感词与语义结构的双重影响也对最终的分类结果产生良性影响。针对电影评论进行情感分类研究时,本文更加注重中文独特的语义特征和语序规则,根据语义特征构建三层条件随机场模型,并在此模型选用的语义特征的基础上融合有序关系构建有向网络图模型,这样的分类算法和模型能更加完整和全面的表现出电影评论的情感特征和分类特点,有效地达到对电影的情感类别划分,为观众在选择决策上提供帮助,为投资者指明投资趋势和方向的目的。