基于领域知识库的客户意见挖掘研究

来源 :西南财经大学 | 被引量 : 0次 | 上传用户:q546609271
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的发展,电子商务对人们的生活习惯产生了深刻影响,网络订餐、网络购物等消费方式成为了现代人生活的重要组成部分,随之而来的是消费者在购物平台上发表的海量评论信息。这些信息看似繁杂,但却具有极大的研究价值,通过对这些评论信息进行深入分析,挖掘出有价值的意见信息,可以为企业或消费者的理性决策提供信息支撑。对于企业而言,意见信息可以帮助企业管理者对产品和服务质量进行监控,便于发现自身问题并及时改进,以提高企业竞争力。而对于消费者,意见信息可以在消费行为中起到指导作用。因此,有必要对电子商务平台上的评论文本信息进行意见挖掘研究。现实中,用户在获取意见信息时通常抱有不同的需求,例如用户需求针对产品的几个主要方面的意见信息,或者产品的某个具体属性特征的意见信息,因此针对篇章级的粗粒度意见挖掘已不能有效地满足用户需求。针对以上问题,本文基于评论文本语料库,利用自然语言处理技术和基于统计的方法构建领域知识库,并将领域知识库引入意见挖掘研究中。通过构建的领域知识库寻找评论文本中能够映射到知识库中的实体概念(评价对象),进而抽取特征观点句。而后,从每一个特征观点句中抽取特征情感三元组,并分析三元组中评价对象对应的情感极性,进而得到特征-情感集合。最后,通过领域知识库中的语义关系网络实现特征-情感聚合,在此基础上,根据用户不同需求构建特征-情感图,将评论文本中的意见信息以简洁而清晰的方式展现出来,以更好地满足用户需求。本文主要工作如下。(1)对文本语料进行预处理,利用NLTK工具库进行词性标注和词干提取,以保证词频统计的准确性。在此基础上,利用基于TF-IDF原理的领域隶属度分析方法从文本语料中抽取评价对象(领域术语),形成评价对象集合。而后,利用逐点互信息(PMI)方法逐层抽取评价对象间的关系,形成语义关系网络,进而构建领域知识库。(2)在对评论文本进行分句后,再切分为小句,使一条小句中只描述一个评价对象。同时,本文提出了一种规则与word2vec模型相结合的方法来构建同义词集合,以保证评论小句中评价对象词被映射到领域知识库中,对于映射成功的小句,我们称其为特征观点句。另外,此方法也保证了后续工作中特征-情感聚合的准确性。(3)从特征观点句中抽取特征情感三元组,并将基础情感词典SentiWordNet与否定词词典结合,形成最终的情感词词典。利用基于情感词典的方法对特征情感三元组中评价对象进行情感分析,并判定情感极性。利用此计算方法,在人工标注的数据中进行评测,平均精确率达到73.6%,以此验证了本文情感极性判别方法的有效性。(4)根据用户不同需求,本文利用领域知识库中的语义关系网络实现了特征情感的聚合,最终构建了特征-情感图,将评论文本中的意见信息以图的形式进行了展示。
其他文献
无线网络、通信技术的迅速发展以及智能终端的广泛应用使得使用WiFi基础设施为室内定位服务(Location-based Service,LBS)提供个人和商业应用成为可能。但是,由于室内环境的复杂性,大多数定位应用通常难以提供令人满意的准确度。因此,设计一个容易部署、硬件简单且定位准确的室内定位系统是目前研究的热点。目前可用于室内定位的传感网络信号有多种,包括WiFi信号、红外线(IR)、超声波、
在生物医学的统计研究中,成对身体器官或身体成对部分的治疗数据,通常是单双边混合的数据,而且存在高度的组内相关性。此外,为了避免一些不同的因素所带来的混杂效应,还需要将这些因素看作分层变量,在分层设计下考虑其统计推断问题。因此,考虑分层设计下基于单双边混合的组内相关数据对两种治疗或方案的治愈率或成功率的统计推断是一个重要的研究问题。首先,考虑分层设计下的单双边混合数据,研究了基于比例比的各种简单有效
二氧化氯消毒剂由于其安全、高效的特点逐渐步入人们视野,已经在城市饮用水、军事、空气防霾、农业、医学、食品加工、造纸等方面有着广泛的应用。本文提出了一种新型制备二
随着光纤传感、光通讯技术日新月异的发展,基于布里渊散射的分布式光纤传感系统在结构检测、温度检测和应变检测领域越来越受关注,并应用于国民经济和国防等产业领域。随着传
随着经济的不断发展,我国制造业也持续快速发展,并在国际上取得了领先地位。在经济快速增长的同时,一些环境问题得以出现,如何实现经济与环境的协调发展即如何实现“低投入”
活性物质是一类非平衡动力学体系,在自然界中广泛存在。其展现的丰富非平衡特性使得它成为研究非平衡统计物理的理想模型系统。近年来,随着各种人工活性物质被设计和制造出来
彩色遥感图像中信息量大,含有重要的感知信息,对特定的感兴趣目标实现自动检测具有重要的应用价值。且近年来,深度学习算法在自然图像的目标检测中表现良好,得益于它非线性处理方面具有优势,但由于遥感图像和自然图像目标属性的原因,直接将其应用到遥感图像中会产生诸多问题,尤其针对遥感图像中的飞机目标尺寸不一、目标小以及多姿态的属性,需要更加高效的目标检测算法。面对彩色遥感图像飞机目标检测的需求,本文基于深度学
随着我国经济放缓进入“新时代”,制造业所面临的产能过剩问题日益严重,这引起了政策制定者的广泛关注。同时,“僵尸企业”也成为学者研究中的大热词汇,但仍缺乏深刻的分析和
干旱是植物面临最主要的非生物胁迫。干旱胁迫下,植物增加根毛的生长,提高吸收水分能力,从而增加耐旱能力。因此,干旱胁迫下根毛生长机制研究是植物耐旱机理的一个重要领域。微丝骨架是调节根毛生长的必需因子。ADF11是拟南芥微丝解聚因子ADFs家族成员之一。AtADF11主要定位于拟南芥的根毛中,而AtADF11的体内功能未见任何报道。本研究分析了AtADF11对根毛生长的影响,并且研究了AtADF11通
唐钢通过对国内外铁精矿粉资源市场进行研判,结合自身烧结工艺条件和原燃料现状,购入南非铁精矿粉、提高自产冀东铁精矿粉产能,以期进一步挖掘铁精矿粉资源效益。铁精矿粉资