面向电子产品评论的方面级情感分析研究

来源 :郑州大学 | 被引量 : 0次 | 上传用户:sprock
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前网络购物盛行,产生了大量产品评论数据,其中蕴含的情感信息极有价值,消费者可以用来指导购物,厂家可以用来了解用户关切改进产品。为了更好地利用产品评论数据,提出了细粒度情感分析,即方面级情感分析的任务,它的目标是从评论中分析用户对产品不同方面的情感信息。本文研究电子产品评论的方面级情感分析,收集了中英文多个电子产品评论方面级情感标注数据集,鉴于中文电子产品评论数据集的缺乏,以及其场景适用性和时效性的不足,构建了 一个全新的中文手机评论方面级情感标注数据集,并提出了基于依存关系和结构注意力网络、基于依存关系图卷积网络两个方面级情感分类模型,取得了良好的实验效果。具体研究内容如下:(1)构建中文手机评论(Chinese Mobile Phone Reviews,CMPR)方面级情感分析数据集。基于京东社区开放API,爬取了 15714条手机评论,进行了短文本、重复及不含方面词评论的删除等预处理操作,制定了标注规范并完成了方面情感标注,形成了一个包含1459条评论的数据集,最后统计分析了数据集包含的方面词总数、评论长度和情感极性分布等多个维度信息。(2)提出基于依存关系和结构注意力网络(Dependency Relation and Structured Attention Network,DRSAN)的情感分类模型。为了解决基于纯注意力机制的方法在关联目标方面情感词上的局限性问题,通过在注意力网络中引入句法信息,使得模型从句子中抽取的情感特征更加依赖于词之间的依存关系。另外,通常一个句子中决定某个方面词情感极性的观点依据可能不止一个,因此为了提高模型捕捉情感特征的可靠性,利用结构注意力同时抽取这些观点依据。最后将两种方法获取的情感特征进行拼接,以此实现情感分类。在多个电子产品和非电子产品评论数据集上,DRSAN的情感分类评价指标均高于对比模型,体现了模型良好的效果和泛化能力。(3)提出基于依存关系图卷积网络(Dependency Relation Graph Convolutional Network,DRGCN)的情感分类模型。完整的依存关系由支配词与从属词之间的依存边和边上的依存标签构成,而DRSAN仅对依存标签利用一种序列方式进行编码,既没有充分利用依存关系,又没有对依存关系树结构进行有效的编码,这使模型只能抽取弱依赖的情感特征。为了编码树结构,基于图卷积网络从两个方面进行考虑,针对依存关系树中节点之间的边和边上的依存标签,构建两个邻接矩阵,利用两个图卷积网络从输入序列中抽取更加完整且具强依赖的情感特征,最后将获得的两种情感特征交由一个双仿射层模块处理,实现情感信息的交互。实验结果显示,在多个电子产品评论数据集上,DRGCN的情感分类评价指标优于DRSAN,这表明DRGCN能够更加有效地利用和编码依存关系树。
其他文献
无纺布作为医疗卫生等领域的原材料,其生产的产品与我们的生活息息相关。在无纺布生产制造过程中,由于生产环境和制造工艺等客观因素的影响,在无纺布表面会产生黑点、白点、断裂、划痕等缺陷。目前,在我国大部分的无纺布生产车间中,都是由人工来检测表面缺陷,检测效率和精度都比较低。近年来,深度学习模型成功的应用于目标检测领域,并且将逐步取代传统的机器视觉对产品缺陷的检测。为此,本文基于改进YOLOv3算法对无纺
学位
静电纺丝技术是利用电场力实现纳米纤维连续制备的一种方法,因其原理和装置简单易于实现,被广泛用于各领域新型纳米材料的研发应用。其中多针静电纺丝技术相比于传统单针静电纺丝的效率低下和无针静电纺丝的纤维直径较大,质量不一,在纺丝效率和纺丝质量上都表现出巨大的优势。多针喷头其针头的排布结构可直接影响纺丝过程中工作电场的分布,继而影响所纺纤维的质量。因此,本文提出了一种正六边形分布的多针喷头,对其电场分布和
学位
随着社会的不断发展,城市化日益加剧,新建筑不断取代旧建筑,城市因此而变,变新,变得人们还要重新认识自己的城市。同时,全球化背景下的单一价值倾向和标准化的建造模式正在侵蚀建筑文化的多样性,丰富多元的地方建筑逐渐消失,这两方面的影响产生了不可逆的趋势。当重新审视建筑,我们很难否认一个事实。对外,建筑与环境的关联不断被削弱,当需要重新认识自己所处的环境时,何谈归属感;对内,因城市过度以及过快发展,快速造
学位
2020年以来,新型冠状病毒在全世界范围内大肆传播,给人们的生产生活带来了极大的不便。佩戴口罩是预防新型冠状病毒的有效手段,但佩戴口罩以后,以往基于人脸识别的门禁系统的识别正确率大幅度下降。在公司或实验室考勤、医院或养老院进出及车站安检等场合,常常需要人们摘下口罩进行识别,不仅麻烦,而且摘下口罩也给防疫带来了很大的挑战。本课题紧密围绕智慧防疫门禁系统的关键工程技术问题,以实现“佩戴口罩”和“未佩戴
学位
随着社会的发展,能源和环境危机愈加严重,开发可再生的清洁能源是亟待攻克的难题。光电化学(photoelectrochemical,PEC)分解水是制备绿色氢能的有效手段之一,然而光阳极的水氧化反应作为一个4电子反应过程,是PEC分解水反应的决速步。氧化铁(Fe2O3)由于其较窄的带隙、合适的价带能级位置、丰富的原料储量,被认为是一种理想的PEC光阳极材料,其理论太阳能-氢能转化效率高达16%。然而
学位
能源是当今社会发展进步的重要推动力。化石能源得到了大量的开发使用,但是化石能源是不可再生能源,而且会带来温室效应和环境污染,因此可再生能源的应用越来越广泛。太阳能是重要的可再生能源,当前最好的太阳能利用装置之一是光伏电池。在光伏系统中加入储能电池作为光伏电池运行时的辅助电源已经非常流行。为了优化光伏电池的输出功率以追踪最大功率点,监测储能电池工作时的状态,对光伏系统中电池模型的内部参数进行辨识尤为
学位
过盈装配是通过工件间的过盈配合来实现装配的一种配合方式,由于其结构简单、对中性好等优点,被广泛用于各种机械装备中。过盈配合的质量决定着机械设备的服役性能,由于在服役过程中受到振荡、冲击、负载等作用,会出现应力集中、偏载等情况,从而造成过盈配合出现松动,甚至在边缘处萌生微动裂纹,因此有必要对过盈配合的质量进行检测。本文通过激光超声的方法评价过盈配合的连接状态,主要包括过盈配合的装配状态,即是否松动;
学位
开放域对话系统是自然语言处理领域的一个重要研究内容,具有广泛的应用前景,感知用户的情绪并生成带有情绪的回复对于开放域对话系统具有重要意义。情绪对话回复生成方面的前期工作大多是基于Seq2Seq架构的,而基于Transformer架构的大规模预训练模型已成为自然语言处理的主流方法。因此,本文研究基于预训练模型的情绪对话回复生成,提出情绪嵌入和多任务学习两种融入情绪的方法,具体内容如下:(1)基于情绪
学位
期货行业是个数据驱动的行业,是数据最丰富的领域之一,随着期货市场逐渐扩大,期货领域相关数据和类型不断增多,但是也存在数据利用效率低,对现有的数据资源价值的挖掘、分析和利用能力较弱的问题。利用期货领域的研究报告构建本领域知识图谱,可以将复杂难懂的研究报告转换为清晰明了的实体关系三元组,有助于期货交易双方提高信息获取效率与分析能力,促进期货领域智能化发展。本文研究期货领域知识图谱的构建方法,主要内容如
学位
近年来,随着机器人应用场景的复杂化及执行任务的多样化等,多机器人协同编队控制成为研究热点。实际应用中,系统内机器人形成期望的队形以完成如编队围捕、编队表演、区域搜索等任务,但随着需要完成的任务越来越复杂、环境越来越多变,对多机器人系统编队控制算法的研究提出了新的更高要求,如算法需能够提高编队效率、优化编队路径,控制器需具有较强的自适应性、鲁棒性和普适性等。针对以上问题,本文在综合考虑算法复杂性和系
学位