面向产品评论的跨领域情感倾向性研究

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:zhegeyonghukeyi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的便捷、共享、普惠等特性使得网民数量与日俱增,网络购物成为人们日常生活中的经常性行为,用户通过互联网购买产品的同时可以发表评论来分享自己的购物体验或对于产品和服务的满意度,这些产品评论信息中包含着丰富的情感数据和商业价值,不仅可以为潜在的消费者提供参考意见,帮助他们作出更加理性的购买决策,还能为产品的生产者和销售者提供产品的反馈信息,有利于他们根据市场反馈了解所提供的产品或服务是否能满足市场需求,以便作出相应的完善方案。互联网上的产品评论信息数量庞大并且呈现出一种激增的态势,这些产品评论信息的挖掘和分析单靠人工是不可能实现的,情感倾向性分析技术应运而生。随着产品多样性的发展,产品评论涉及到汽车、手机、酒店等多个领域,跨领域情感倾向性分析技术能够实现利用源领域数据的情感标签对目标领域数据进行情感倾向性分析。然而,不同领域的数据由于收集方式和途径不同,通常服从不同的数据分布,对传统的情感分类方法造成了一定挑战。针对这个问题,本文提出两种跨领域情感倾向性分析方法:一种是基于可信标签扩展传递的词语级跨领域倾向性分析方法,另一种是基于组合框架模型的跨领域产品评论情感倾向性分析方法,下面分别予以介绍。基于可信标签扩展传递的词语级跨领域倾向性分析方法是解决词语级别的跨领域情感倾向性分析问题。首先选取枢纽特征集作为情感种子词集,种子词与目标领域待标注词之间按照相似度进行标签传递,计算所分配的标签的可信度,将具有可信标签的词移入情感种子词集,达到种子词集扩展的目的,最终计算出目标领域词的情感分,然后利用其先验情感分进行优化,最终实现词语级跨领域倾向性分析。基于组合框架模型的跨领域产品评论情感倾向性分析方法是对产品评论进行跨领域情感倾向性分析。结合词典规则情感分类方法和机器学习情感分类方法的不同特点,构建一个组合框架模型将词典规则分类器和机器学习分类器进行有机融合,根据标签一致性原则,将两种分类器分类结果一致的部分目标领域数据迭代加入训练集训练新的分类器,对其他待标注数据进行反复测试,直至迭代结束。本文在多个产品评论领域交叉进行实验以验证两种跨领域情感倾向性分析方法的可行性,结果表明本文提出的基于可信标签扩展传递的跨领域倾向性分析方法对于词语级别的跨领域情感倾向性分析以及领域情感词典的扩展具有重要作用,实验也证明了本文提出的组合框架模型能够在一定程度上提高跨领域产品评论情感倾向性分析的精度。
其他文献
人工神经网络(Artificial Neural Network)是一种旨在模仿人脑结构及其功能的信息处理系统,它是对人脑神经网络的简化、抽象与模拟。目前已有上百种的人工神经网络模型,这些
不同种类的纤维纺织品,其强度、截面粗细、纵向长度、卷曲度等特征信息均不相同。同一种类的纤维纺织品也会存在个体差异。这些特征信息是判断纤维对象成熟度的重要标准,是纤
无人飞行器航迹规划就是在特定约束条件下,寻找满足无人飞行器机动性能及战场环境限制的,从出发点到目标点的最优飞行轨迹,是无人飞行器进行自主飞行的关键技术。本论文针对
随着无线网络技术的广泛应用,无线局域网(WLAN)的相关技术也越来越成熟,WLAN以其灵活性和移动性等优势成为网络技术领域的热点话题,同时WLAN也因其自身固有的特点,如传输介质的开放
传统的机器学习和数据挖掘算法大多基于这一假设:训练数据集和测试数据集具有相同的特征空间和数据分布,因而更侧重于与其他任务或者先前学习到的知识相互独立的单任务学习。
医院采集的原始数据逐年增多,大量的病人的基本信息和各种病例等原始数据都被存储了下来,这些激增的数据背后潜藏了大量有用的知识。如何抽取、挖掘出这些知识是当前的研究热
随着计算机的普及和办公的自动化,工作流技术得到了迅速的发展和广泛的应用,并催生了许多工作流管理系统。为了满足应用需求这些系统通常运行时间较长,运行条件和环境复杂多
随着信息技术的发展,人们通过计算机、网络来使用越来越多的信息。网络中传输的图像和视频往往受限于网络环境,网络拥塞和带宽不稳定等因素都会影响图像恢复。在有特殊要求的
随着因特网中应用的爆炸性增长与网络通讯技术的发展,无论在国防、财政和电源产业等传统领域,还是在新兴的可信计算和网络、云计算系统和下一代互联网等领域,网络的可靠性都得到
随着计算机网络在学校的教学科研等活动方面应用的深入,其网络安全问题也逐渐突出,这对校园网络的应用产生直接的影响。因此,运行一套行之有效的校园网络安全管理与维护系统是校