面向论坛的商品评论倾向性分析方法研究

来源 :西安建筑科技大学 | 被引量 : 0次 | 上传用户:guoguo1guoguo1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如何快速、准确地获取互联网上商品的评论信息,分析出其蕴涵的褒贬倾向,对商家掌握消费者喜好变化和辅助潜在消费者做出购买决策等方面都具有极其重要的意义。然而采用人工方式对互联网上如此浩如烟海的无结构的评论信息进行筛选、归纳是一个费时费力的过程。因此,文本的倾向性分析研究成为了当前自然语言处理的一个研究热点。本文旨在研究倾向性分析中评价对象和评价词识别、情感词语义倾向判别等关键性技术,根据现有研究所存在的瓶颈,结合统计学、语义分析学等方法,探索领域本体对倾向性分析提供的支持和作用,论文主要完成的工作如下:(1)针对目前大部分基于规则的评价对象抽取方法只能找出频繁的评价对象,对于非频繁评价对象抽取的准确率较低的缺点,以汽车领域为例,给出了一种组合式领域概念获取方法,从而克服了统计学在概念获取时语义信息上的缺失,利用Protege工具构建汽车领域本体,尝试采用基于领域本体和SBV的评价对象、评价词的二元组抽取算法(I-SBV),以提高评价对象抽取的准确率,并实现产品属性关系的识别。(2)考虑到现有情感词典在构建过程中忽略了评价对象对情感极性的影响,同时根据网络语言常常出现缩写、简写等情况,构建了针对汽车领域的情感词典,包括静态情感词典、动态情感词典、修饰词词典三部分,其中静态情感词典融入了网络常用词,运用扩展的SO-PMI算法对未登录情感词极值进行计算,并给出了动态情感词倾向值的计算公式,为实现基于情感词典的倾向性分析提供了良好的基础。(3)以领域情感词典为基础,考虑到修饰词对评价词语倾向值的影响,给出了情感词上下文极性值的计算方法。将情感词短语和评价对象作为计算句子极性值的基本单位,利用本体概念及其属性间的关系对情感词倾向值进行加权求和,从而得到句子倾向值,实现句子级倾向性判别。基于上述研究,完成了针对汽车论坛的评论倾向性分析系统的设计与实现。
其他文献
学位
近年来,随着遥感技术、传感器、网络技术等技术的发展,地学空间数据获取单位不同、数据量比较大、数据结构多样,并且呈现几何指数式增长。在空间信息领域,使用面向服务架构和
随着我国高等教育由精英教育转变为大众教育,高校毕业生就业形势日趋严峻。大学生就业日益困难的一个重要原因就在于就业预期偏高,且主要表现在对于薪酬的预期过高。大学生对
随着网络化信息化的不断深入与发展,企业的内部有很多信息管理系统,如办公自动化系统、客户关系系统、供应链管理系统、财务管理系统、生产管理系统等等。因为Web环境中基于B
在如今互联网普及、家庭电子产品多样化的时代,对家庭播放机的要求也日渐提高。因此,探究红光高清视盘播放机通过网络进行音视频播放势在必行。一旦播放机借助于网络获取音视频
在DAS模型中,用户的数据存储在第三方提供的数据库服务提供端并由第三方负责查询、管理,这种拥有数据库管理员权限,可以随时的访问数据库所有数据。这种情况下,数据库中敏感数据
随着社会经济和互联网技术的飞速发展,客户对产品的个性化要求不断提高,以产品为竞争基础的传统模式正逐渐被以客户为中心的新兴模式取代,细分市场进入到大规模定制时代。大
在分布式文件系统中,一个数据服务器同时要处理来自多个客户端的I/O访问请求。如果数据服务器没有足够的资源来处理所有已到达的以及即将到达的I/O访问请求,大量的I/O访问请求
人脸识别技术不仅是一个交叉性的技术,更是一个富有挑战性的难题。与其它物体相比,由于人脸有多种多样的变形,个体间的差异较大,所以人脸图像特征提取和识别过程比较复杂,而识别算
在过去十年里,语义Web经历了爆炸式的增长。随着语义Web中RDF数据量的增长,其结构和内容也在发生着变化。为了帮助人们了解语义Web的结构和内容,本文通过建立几种链接模型,分析其