面向产品评价的观点挖掘方法研究

被引量 : 0次 | 上传用户:sbtlan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,更多的消费者开始通过Internet了解、购买产品并且发表评论。面向产品评论观点挖掘就是为了从海量的评论信息中挖掘出用户关心的事物的情感倾向性,可以帮助潜在消费者更好地了解产品,以及为制造商提供改善产品或服务决策的依据。相对于目前主要研究的句子或篇章级别情感分类,用户更期待细粒度属性级别的意见挖掘结果。现有的意见挖掘主流方法中,利用规则的抽取方法灵活性和扩展性有待于提高;而基于隐马尔可夫模型或条件随机场的属性抽取方法则不能很好的处理长距离情感要素依赖的问题。此外,目前的产品评价意见挖掘算法往往忽略了两类特殊的情感表达句式的处理,即比较情感句和否定情感句。本文工作主要集中在以下几个方面:第一,改进了产品评论中的细粒度评价单元抽取算法。该算法将评价单元抽取问题转化为结构化序列标注问题,并引入了词语的属性标识、词语在依存句法树上的依存关系(顺序结构,连词结构和句法结构)作为新特征。在细粒度情感分析语料库CUHK-HIT Opinmine上对该模型进行实验验证显示。第二,在此基础上通过计算属性词与对应于面向领域本体评价概念节点实例词语之间的相似度以及二者各自关联的评价词之间的相似度,实现了面向领域的评价概念节点实例词的扩充。通过引入评价概念节点词语知识,进一步提高了产品评价挖掘的性能。第三,分别研究了基于规则和基于最小多支持度的类序列规则的统计机器学习的方法用于比较情感句的识别。再次基础上研究了基于条件随机场比较要素抽取方法,并利用比较句的句式特征对比较要素的情感倾向性进行了判别。第四,研究了基于否定词表和判定规则的方法,利用子句的情感倾向性计算整段文本的情感倾向性。实现了否定句的情感倾向性判别。本文主要贡献如下:首先,改进了细粒度评价对象和评价词抽取算法,相对于树结构条件随机场在CUHK-HIT Opinmine数据集上评价对象抽取准确率和召回率各提高了4.8%和3.5%。其次基于类序列规则的统计机器学习的比较句识别方法在COAE2012比较情感句分析数据集上召回率达到79.3%,准确率达到87.0%的成绩。此外,实验显示本文提出的基于规则的否定句情感倾向性判断取得了较好的效果。
其他文献
术后认知功能障碍是手术后常见的一种并发症,尤其在全身麻醉后。表现为以记忆力和精神集中力损害为主要特征的认知功能损害,常持续数周或数月,导致病死率增加、康复延迟、其
溃疡性结肠炎的诊断条件包括临床表现、结肠镜改变、钡灌肠与肠黏膜组织学等,诊断标准应根据上述条件的不同组合分为疑诊与确诊,结肠镜与黏膜活检最为重要。强调在排除诊断基
本文针对企业并购重组财务风险的防范,结合理论实践,在简要阐述企业并购重组财务风险特征的基础上,分析了企业并购重组中常见的财务风险,并提出相应的防范对策。得出做好目标
为了给地面航天器模拟器提供零重力太空环境,并满足“自由—自由”的边界条件,本文提出了一套气动弹簧竖直悬吊系统的设计方案。该系统具有大承载能力、低刚度、低频率、低摩擦
高年级学生已经进入绘画的视觉写生期与客观写实期,通俗地说,这一阶段的学生想画得像。但画得像不是儿童画创作的唯一目标,还应关注学生想象力的发展。那么,如何让学生在想象
在国内光伏业遭遇欧美“双反”等不利形势下,2012年江苏泰州市新能源产业园区实现逆势上扬。园区预计全年实现规模以上工业总产值170亿元,同比增长13%;高新技术产业产值130亿
目的了解维持性血液透析患者的血管钙化情况,探讨其危险因素。方法收集90例维持性血液透析患者的临床资料,拍摄骨盆、双手X线片,计算血管钙化评分,测量血压水平,检测钙、磷等
中国的青铜器在材料,形状和图案方面具有丰富的文化底蕴,并将青铜文化融入城市雕塑景观中。它不仅可以增强城市景观的文化内涵,而且还会对观众的心理产生积极的影响。总结中
对网络控制系统(Network Control Systems,NCS)的故障诊断研究越来越受到相关学者们的重视,但由于网络诱导时延、数据包丢失、时序错乱等因素的影响,使得NCS的故障诊断变得相当复
一提起中国对西方的影响,人们首先会想起的是“四大发明”。诚然,四大发明作为中国所创造出的灿烂文化的重要部分,改变了亚洲人、欧洲人乃至全世界人民的生活,但是,中国对西方的影