基于词性与句法的产品评论特征及情感词挖掘

来源 :河北大学 | 被引量 : 0次 | 上传用户:liliqqqq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人们在网络上购买商品后,习惯于在商家提供的平台上留下对产品优劣的评价。潜在的消费者可以通过产品评论了解产品信息来决定自己的选择,商家也可以根据评论来学习别人的优点改正自己的不足。其中,评论中的情感词对于分析评论的态度具有决定性作用,而情感词所描述的特征词则反映了用户关注的焦点。因此产品评论挖掘的主要任务之一就是挖掘评论中的情感词与特征词。本文所做工作主要有如下几个方面:给出了一种对评论进行规范化和切分的预处理方法。对评论的格式进行规范和统一,之后将评论切分成短句。通过对评论的预处理有助于文本处理工具对评论取得更好的处理效果。在挖掘情感词时,考虑到情感词和特征词在词性组合上的搭配模式,给出了基于词性模板的情感词挖掘方法。该方法从种子评论集中提取匹配情感词的词性模板,应用模板对情感词进行挖掘,随后通过停用词集和依存关系对挖掘结果进行双重剪枝。最后的挖掘结果既包含评价产品显性特征的情感词,也包含评价产品整体和隐性特征的情感词。在挖掘特征词时,给出了基于情感词的特征词挖掘方法。通过评论中情感词的位置,定位特征词所在的句子片段。通过词性搭配与句法结构相融合的方式,对特征词进行自动匹配,达到特征词与情感词的对应。匹配的结果在识别高频特征词的同时,对低频特征词也可较好识别。实验结果表明,应用本文给出的产品评论挖掘方法能够取得较好的挖掘效果。
其他文献
随着电子商务的兴起,网络客户评论也必然会成为人们购买产品和商家改进自身服务的重要参考,但是如何从海量评论中挖掘出有用信息是一项具有挑战性的工作。产品特征挖掘作为网络
嵌入式系统、网络系统、传感器系统以及微控制系统的快速发展将二十一最热门的技术——无线传感器网络系统带入了新纪元。所谓的无线传感器网络就是向人类感兴趣区域随机抛撒
学位
随着移动计算、全球定位系统以及地理信息等技术的迅速发展,特别是无线网络技术的日益盛行,基于位置的服务得到了广泛的应用。最近邻查询作为基于位置服务中最重要的查询类型,引
随着计算机流体力学(以下简称CFD)技术和计算机技术的飞速发展,CFD在航空、航天等领域中应用的地位越来越高,作用也越来越大。然而,CFD固有的不确定性对用户CFD经验和知识的依赖等
语音是我们日常生活中最自然和广泛的交互方式,计算机诞生以后,为了使得人与计算机能够进行对话交流,语音技术就引起了计算机科学家们广泛的关注和研究。连续数字语音识别在现实
无线射频识别技术(Radio Frequency Identification,RFID)是八十年代兴起的一种自动识别技术,该技术通过无线电的传播来实现对目标的识别。RFID技术与其他自动识别技术相比具有
近年来Web服务技术得到快速发展和应用,其互操作性机制得到产业界和学术界的广泛认可。然而Web服务却有其明显的缺陷,在一些基于Web的关键任务系统中,如何提高Web服务的质量,例如
随着移动通信技术的发展和人们日常生活水平的提高,LBS业务的重要性也日益上升。目前,全球许多移动运营商已经开始部署LBS业务。A-GPS技术继承了传统GPS定位高精度的优点,并大幅
制粒与包衣是中药片剂生产过程中的两个关键环节。目前中药产业的生产先进技术应用成熟度和自动化与智能控制程度均不高,造成中药有效成分含量低、杂质多,质量不稳定、生产成本高、浪费和耗能大等问题,制约了中药产业标准化、现代化和国际化进程。因此,采用先进单元制造技术及其装备,并应用在线检测等新方法和新技术,优化各工艺参数,对于实现传统中药生产工艺技术与设备的升级与改造,解决中药生产过程质量控制的难题,保证产