基于协同双向编码器的情感分析模型研究与应用

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:lywy0201
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,越来越多的消费者在购物平台上留下评论信息。用户评论往往包含顾客在消费过程中对服务、质量、性能、价格等多个方面的情感倾向。一些商家希望从顾客的评论中挖掘商品各属性的口碑,以辅助经营。同时,越来越多的消费者正尝试从其他顾客的评论中获取详细的商品评价,以辅助消费决策。如何自动化地从用户评论中提取多个指定属性的情感倾向,以便提供详细的用户情感分析报告是亟待解决的问题。细粒度情感分析对该问题开展了研究。大部分情感分析任务针对文档级别,将一篇文档作为整体实施情感分类,并已经在基于统计机器学习和深度学习的方法上获得了长足的发展。由于细粒度情感分析任务需要对评论中的多个属性判断情感倾向,一些研究者将该问题转化为针对各属性的文档级别的情感分析问题。这种方法使各分类器间无法共享学到的知识,阻碍了性能提升。针对细粒度情感分析任务开展研究需要大规模数据集的支持。受到长尾效应的影响,真实世界的大规模数据集往往存在类别不平衡的问题。首先,本文对一个包含12万样本的网络食评数据集进行分析,并针对数据集中存在的类别不平衡问题,提出了基于词替换和文本拼接的数据增强方法。使用一个基于长短期记忆网络的模型,在数据集上进行探索性实验,证明了2种方法的有效性。然后,针对该数据集上的细粒度情感分析任务,提出了协同双向编码网络(Co-bidirectional Encoding Network,CENet)。CENet对相关方法提出以下3点改进:其一,针对中文分词后数据稀疏等问题,使用字向量与词向量融合的文本表示方法。其二,在各个属性上分别训练分类器无法利用评论文本中各评价单元的边界信息,降低了学习效率。针对该问题,使用多层自注意力机制,并行化地在各个属性上训练分类器,并通过一个双向长短期记忆网络实现并联,使各分类器之间共享知识,协同工作,加强对各自属性上特征的学习。其三,针对注意力机制对位置不敏感的问题,将位置编码融入字、词向量,并使用对位置敏感的注意力机制学习字、词的位置特征。在上述网络评论数据集上的对比实验表明,CENet拥有良好的表现,且从本文提出的数据增强方法中得到进一步的性能提升。最后,基于Tensor Flow Serving、Flask和Vue等技术,使用CENet模型构建了一个用户评论自动化情感分析及数据可视化平台。
其他文献
埃塞俄比亚于2009年11月开始正式汉语教学。截至2015年9月,埃塞俄比亚的大城市和几所影响力较大的高等院校都开办了孔子学院。汉语在埃塞俄比亚发展迅速,但埃塞俄比亚汉语教学的研究成果很少,埃塞俄比亚学生汉语学习的研究甚至处于空白阶段。语言学习中的词汇学习策略问题受到了越来越多的关注,词汇学习对二语习得至关重要。在语言输入方面,尤其是口头交际中,词汇信息往往是决定语义关系的部分,不了解词义的情况下
说起党的十九大以来有关反腐的现象级事件,"主动投案"绝对算一个。自2018年7月河北省政协原副主席艾文礼携带赃款赃物到中央纪委国家监委投案以来,"主动投案"逐渐成为案件通
目的:随着人们法律意识的增强以及对医疗服务要求的提升,医疗纠纷案件发生越来越频繁,本次研究针对苏州市某区医疗纠纷情况进行调查分析,并提出防范措施,旨在探讨有效处理医疗纠纷事件的正确方法,为日后避免医疗纠纷提供有益借鉴。方法:对苏州市某区三级医院2015年至2018年期间的140例医疗纠纷案开展回顾性分析,了解医疗纠纷的分布特征,探讨纠纷主要原因以及处理途径,并通过调查问卷分析了解医务人员和患者对医
翻译是一种跨文化的交流活动,在“一带一路”的背景下,中外文化交流活动深入开展,对翻译的需求日渐增多。“看中国”是由北京师范大学中国文化国际传播研究院发起的一项中外青年跨文化体验项目,旨在透过外国青年电影人的独特视角,以每人拍摄完成一部10分钟的中国文化短片的方式,提升国际社会对中国的了解,传播中国文化,迄今已成功举办9届,在国内外获得越来越广泛的影响力。本翻译报告的分析案例来自《2018看中国·外
学位
冷喷涂金属基复合涂层较单一金属涂层,拥有更好的物理性能和机械性能,且冷喷涂技术制备复合涂层几乎不受硬质相材料和种类的限制,可直接将颗粒的原始性能直接转移到复合涂层中。而涂层中硬质相的含量和分布直接影响着涂层的服役性能和寿命。因此,本文拟以冷喷涂硬质相增强Al基复合涂层为研究对象,探索影响涂层中硬质相含量及分布的主导因素,从而为调控涂层性能、推广冷喷涂复合涂层在快速制造及零部件修复的应用提供重要的理
酶反应是生物化工过程的核心和关键,然而酶催化反应过程往往受到传质和产物抑制的局限。本研究以设计“选择透过性”的微流控双水相液滴流界面为出发点,消除产物抑制,突破反应平衡的限制,探究微尺度下运动状态双水相液滴流的运动状态,揭示双水相液滴流强化酶催化反应的机理,以此为基础开发基于尿素快速检测的微流控双水相液滴流酶催化反应方法。研究成果为制药、食品、传感器和分析检测等领域的酶催化反应过程强化提供理论支持
全要素生产率是度量一国或地区经济增长质量的重要指标。已有研究表明,国际贸易特别是不同属性商品的进口贸易是影响全要素生产率变动的重要因素之一。进口对全要素生产率的促进作用至少可以通过进口数量效应、进口种类效应等途径来实现。但是,尚未发现有相关研究对农产品进口和农业全要素生产率增长之间的关系进行专门研究。本论文在充分借鉴国内外相关研究基础上,主要采用浙江统计年鉴、国研网和海关信息网等官方统计数据库数据
铁路运输一直是各国重要的交通运输方式之一。截止2019年底,我国铁路运营总里程超过了13.9万公里,其中高铁里程达到3.5万公里,稳居世界第一。随着高速铁路的大量运营,对货物运输有了更高的要求。2000年以来,我国先后研发了多种快捷货车,用以提高运输效率、降低运输成本,为大面积开行快捷货物运输创造了条件。转向架作为铁道车辆的重要组成部分,其结构和性能的好坏直接制约着轨道车辆的运行性能,而内轴箱转向
本毕业报告基于政府经济贸易公文2018年《中国商务年鉴》翻译实践撰写而成。《中国商务年鉴》由商务部主持编纂,是权威商务文本,描述了中国的发展状态及来年的发展方向,概括了一年中世界的经济变化。本年鉴每年出版一期,每期用中文、英文两种文字分册出版,在展示经济发展情况方面有着重要意义。在本次翻译项目中,译者所翻译的部分为《中国商务年鉴》各栏目中商务目录、国际商品市场、国别商务、地方商务等文本,共计四篇,
学位
近些年来,人脸识别技术发展迅速并被广泛的应用于各行各业。然而,来自非法用户的人脸欺骗攻击却给人脸识别技术的应用带来了很大的安全隐患。为了解决这一问题,人脸活体检测技术应运而生。本文首先总结了现阶段人脸活体检测领域的研究成果,并针对现有检测方法在跨数据集检测时检测准确率低等问题,研究了基于检测场景中的上下文信息以及人脸视频中的时域与纹理特征的活体检测方法。本文所做工作如下:1.研究了一种基于上下文信