【摘 要】
:
在现实生活中,随着网络的迅速发展,产生了越来越多的网络平台,如电影网站、购物网站、新浪微博网站等。人们倾向于在这些网络平台上针对某些内容发表自己的观点和意见,因此出现了大量含有情感极性的评论文本,对这些评论文本数据进行情感极性挖掘具有非常重要的意义。目前大部分的情感分析算法在对评论文本数据进行分析时,通常使用神经网络搭配注意力机制的方式。同时,在注意力机制中融合其它信息辅助注意力权重分配是一种提高
论文部分内容阅读
在现实生活中,随着网络的迅速发展,产生了越来越多的网络平台,如电影网站、购物网站、新浪微博网站等。人们倾向于在这些网络平台上针对某些内容发表自己的观点和意见,因此出现了大量含有情感极性的评论文本,对这些评论文本数据进行情感极性挖掘具有非常重要的意义。目前大部分的情感分析算法在对评论文本数据进行分析时,通常使用神经网络搭配注意力机制的方式。同时,在注意力机制中融合其它信息辅助注意力权重分配是一种提高情感分析算法性能的方法,但是目前该类方法仍然存在没有充分利用其它辅助信息的问题,导致算法的性能不佳。本文围绕该类算法进行研究,提出了两种改进注意力机制的算法,通过交互式计算的方式在注意力机制中融合其它辅助信息以改善注意力机制的权重分配,提高情感分析算法的最终性能。主要研究内容包括:(1)针对现有方面情感分析算法中注意力机制存在偏好的问题,提出了一种基于方面频次信息交互融合的情感分析算法SIFAF(Sentiment analysis based on the Interactive Fusion of Aspect Frequency information)。首先统计方面项的频次信息,利用频次信息构造嵌入向量,将方面项频次嵌入向量与相对位置嵌入向量相连接输入到Bi LSTM网络中提取方面频次信息的隐藏状态,然后在注意力层对提取的方面频次信息隐藏状态、方面项隐藏状态以及上下文隐藏状态进行交互式计算得到各隐藏状态的注意力权重,根据权重更新各隐藏状态向量,通过多次训练更新得到方面项的最终表示向量,最后利用softmax分类器对方面项表示向量做情感类别计算。在两个公共数据集Restaurant和Laptop上的实验结果表明,本文提出的算法效果更好,相较于其它基准算法,该算法在上述两个数据集上的二分类准确率平均分别提升了2.69%、1.87%,三分类准确率平均分别提升了4.30%、4.54%。(2)针对现有文档情感分析算法中存在多类信息简单堆叠、无法充分利用的问题,提出了一种基于多类信息交互融合的情感分析算法SIFMT(Sentiment analysis based on the Interaction and Fusion of Multiple Types of information)。首先获取到多类信息,利用获取到的多类信息构造嵌入向量,然后将各类信息嵌入向量输入到Bi LSTM网络中提取多类信息隐藏状态,通过在注意力层对提取的多类信息隐藏状态与上下文信息隐藏状态进行交互式计算得到最终的注意力权重,根据权重更新上下文隐藏信息并生成最终的文档表示向量,最后利用softmax分类器对文档表示向量做情感类别计算。在IMDB、Yelp2013、Yelp2014三个公共数据集上的实验结果表明,本文提出的SIFMT算法相比于其它对比算法在上述三个数据集上的多分类准确率平均分别提升了10.16%、7.5%、7.36%。实验结果验证了本文提出算法的有效性。
其他文献
法律文本的翻译,对加快全球法律文化交流有着举足轻重的作用。其中,司法判决书的翻译是法律文本翻译的重要形式之一。本翻译报告原文为奥克兰地区法院审理商业委员会诉钢管控股有限公司一案之后所制作的司法裁决书。从功能对等理论的角度,本翻译报告讨论英文法律判决书的具体翻译方法,旨在通过此类法律文书的翻译实战和理论的相关探讨及其合理结论,为同类法律文书翻译提供一定价值的参考。在翻译原文的过程中,为准确地再现原文
锂离子电池荷电状态(State of Charge,SOC)的准确估算对其在电动汽车上的应用十分重要。SOC在估算时受到各种条件的影响而产生误差,为了尽可能减少估算误差,国内外研究者提出了多种估算方法。本文针对18650型锂离子电池的SOC估算方法进行研究,提出了基于自适应迭代无迹卡尔曼滤波(Adaptive Iterative Unscented Kalman Filter,AIUKF)的SOC
邻苯二甲酸酯(Phthalic Acid Esters,PAEs)是一种环境激素,该化合物的主要特性包括难挥发、不溶于水但易溶于甲醇和乙醚等有机溶剂、有特殊气味并且附有毒性等;主要用途是作为添加剂(塑化剂)参与到塑料产品的制作过程中。邻苯二甲酸二(2-乙基己基)酯(Diethylhexyl Phthalate,DEHP)在塑料制品特别是聚氯乙烯的生产过程中作为塑化剂使用。DEHP与塑料主体的结合方
随着工业4.0的稳步推进,工业控制系统逐渐成为全球各个工业生产领域中的重要部分。随着工业控制系统孤立网络发展的成熟和应用瓶颈,该系统开始逐渐接入复杂的外部网络环境中以适应工业物联网和工业信息物理系统等新兴技术。然而外部网络的复杂性导致工业控制系统面临这严峻的安全挑战,因此工业控制系统的信息安全问题亟待解决。入侵响应机制作为工控系统中入侵对抗统体系的最后一道屏障显得尤为重要,因此本文将针对入侵响应机
细胞的正常运转需要通过不同细胞器之间的信息传递和物质交换进行紧密调节。自噬流和内吞流是细胞进行信号传递和物质运输的两条关键途径,对细胞稳态、信号转导和细胞免疫至关重要。目前用于监测自噬流和内吞流的荧光探针大多是通过对p H值变化和极性转变的检测间接实现对内吞流和自噬流的监测。基于此设计的荧光探针对细胞微环境变化高度敏感,使得其成像性能缺乏足够的稳定性。生物正交点击反应是典型的双组分反应,可以在生理
为解决传统LCC-HVDC(Line Commutate Converter Based HVDC)存在的问题,如换流变压器噪声污染严重、逆变侧换相失败、谐波治理、无功平衡、变压器谐波损耗大等,课题组提出了一种LCL-HVDC,为使这种新型的直流输电技术走向工程应用,还需要研究一系列的理论与技术。本文仅就其中LCL-HVDC的无功平衡特性开展研究。与LCC换流器拓扑结构相比,LCL换流器去掉了交流
将甲苯C-H键选择性氧化制备高附加值的苯甲醛是化工领域重要的研究课题。由于甲苯中C(sp~3)-H键活化需要较高的能量,工业生产需要进行预活化或在高温高压条件下进行,不仅能耗高而且会产生环境污染等问题。光催化甲苯选择性氧化技术因其利用清洁、可持续的太阳能作为能量来源,反应条件温和而备受研究者们关注。光催化技术的核心是稳定、高效的光催化剂。硫化镉(CdS)是一种具有合适能带结构、对可见光响应的光催化
汽车作为一种消费品,随着经济社会的发展和人民生活水平的改善,已走进千家万户,但相伴而至的还有不断涌现的汽车消费纠纷及消费者权益屡受侵害问题。基于此,国家质量监督检验检疫总局(现隶属市场监督管理总局)于2013年10月1日颁布了《家用汽车产品修理、更换、退货责任规定》(以下简称《汽车三包规定》),正式确立了我国的汽车“三包”制度。虽然专门的汽车消费者权益保护制度已经建立,但基于现实案例实证分析可以看
大陆法系辩论主义运行模式下,判决基础资料的形成依赖于当事人的主张和举证行为。当事人的主张行为在法规范上归属于主张责任理论范畴,举证行为归属于举证责任理论范畴。我国民事诉讼理论对于证明责任相关研究较多,对主张责任理论重视不够。证明责任适用的前提是争议的要件事实真伪不明,真伪不明指事实未在诉讼中得到证明,对真伪不明的判断有五个前提条件:第一,原告方提出有说服力的主张;第二,被告方提出实质性的反主张;第
电磁成形技术是改善轻质合金材料难成形性的一种重要技术手段。电磁成形过程涉及热力学、机械、电磁学等多学科交叉,以有限单元法为代表的数值模拟技术能有效的求解这一复杂过程。但电磁成形的数值模拟通常基于商业有限元软件,随着有限元技术的飞速发展,在这些闭源商业软件上添加新单元、新材料和新算法成为一项挑战。同时,在求解大规模复杂的电磁成形过程、探讨电路参数对成形性能的影响时,存在计算效率低、精度差等问题。针对