融合浅层和深层特征的文本情感分析方法及应用

来源 :河北地质大学 | 被引量 : 0次 | 上传用户:s362613932
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着微博等网络平台的发展,越来越多的人愿意表达自己的情感和观点,因此大量的主观性文本在互联网中堆积。通过挖掘文本中的信息,可以及时的了解人们对某一问题的情感倾向。文本情感分析就是通过计算机自动识别文档中的主观性观点,并判断整篇文档的情感倾向。近年来,文本情感分析方法中表现较好的是深度神经网络,尤其是卷积神经网络(Convolutional Neural Networks,CNN)和双向长短期记忆网络(Bidirectional Long Short Term Memory,Bi LSTM)。这些方法的核心思想是从文本数据中提取深层次的语义局部特征及上下文全局特征进行情感分类。但也存在一些不足,如没有考虑不同的特征对分类准确率的影响不同,不同词性的词语包含的情感信息也不同等。本论文针对情感分析深度神经网络模型存在的问题,研究情感分析模型和算法,主要内容如下:(1)针对融合CNN和Bi LSTM特征模型提取特征不全面,及未考虑各特征对结果的影响不同的问题,提出一种融合局部和全局关键特征的情感分析方法(Fusion of Local and Global Key Features,LGKF)。该方法通过增加卷积核的种类,提取更全面的局部特征表示;引入注意力机制,区分特征表示对分类结果的不同影响。在三个数据集上进行实验,结果表明该方法在准确率上较原方法提高了4%左右。(2)针对融合局部和全局关键特征方法中没有考虑词语的词向量维度层面信息的问题,提出一种融合可变卷积和Bi LSTM关键特征的改进方法(Fusion of Variable Convolution and Bi LSTM Key Features,VCBKF)。该方法改变卷积层的卷积方式,从文档句子方向纵向卷积,词向量维度方向横向卷积;在池化层,利用最大池化和平均池化两种方式保留特征中的重要信息。实验结果表明,该方法在分类准确率方面相比于LGKF模型提高了1%左右。(3)针对融合可变卷积和Bi LSTM关键特征方法中没有考虑文档浅层特征的问题,提出一种融合文档浅层和深层特征的方法(Merging Surface and Deep Features,MSDF)。该方法在输入数据中增加了词语的词性向量,使得情感分析模型能够从词向量和词性向量中提取更准确的深层语义特征。在两个英文数据集上的实验结果表明,该方法的分类准确率高于其他模型的准确率。
其他文献
完好结构在局部发生初始损伤时,会引起结构局部或整体发生与初始损伤不成比例的失效,造成连续倒塌的发生。在已有关于RC结构连续倒塌研究中,通常忽略了钢筋锈蚀的影响。事实
潮剧是中国广东潮汕地区及福建漳州等地流行的一种传统地方戏剧,其随着华侨华人的移民足迹活跃在海外。因此潮剧艺术也成为海外华人社会中独具中华民族文化精神的重要艺术形式。本文以泰国乌汶潮剧艺术为例,立足于戏剧人类学研究方法,围绕泰国乌汶潮剧艺术的渊源与变迁、泰国乌汶潮剧艺术与华人民间信仰、泰国乌汶潮剧艺术展演与信仰空间以及其社会功能这四个方面对泰国乌汶潮剧艺术及展演与华人信仰的关系、该戏剧艺术存在的原因
目的本研究在习总书记提出的“健康中国”大背景下,通过调查国内医学院校护理学专业人文课程开设的现状,分析目前存在的主要问题,理清提升护生人文素养所需要的知识结构与课程内容,探讨整合与优化的方向并构建具体的内容,为今后护理学专业人文课程教材的编写以及具体的课程内容设计提供了参考。方法1、本研究通过查阅文献及网站资料,了解目前国内外护理学专业人文课程开设现状与发展趋势,理清提升护理学专业学生人文素养所需
目的:研究穿破石对输卵管炎性阻塞性不孕症模型大鼠TGF-β/Smads信号通路表达的影响及其作用机制,为输卵管炎性阻塞性不孕症的治疗提供新的思路。方法:采用解脲脲原体、金黄色葡萄球菌、大肠杆菌1:1:1混合菌液,明胶海绵经阴道接种建立SOI大鼠模型。模型成功后,随机分成空白组,假手术组,模型组,穿破石低、中、高剂量组,妇炎康软胶囊组7组。分别予相应的药液经灌胃30d后,处死大鼠,并取输卵管组织,显
在物理考试中,考生最容易失分的不单纯是某个知识点,还有考试中答题步骤书写不规范。高考主观题占物理总分的70%,由实验题、计算论述题及选考题组成,重点考查高中物理的主干知识和学科综合能力。对物理试卷进行规范的书面表达是考生必备的基本功。这也是制约一部分优秀生不能得满分、高分的因素之一,特别是实行网上阅卷后,对解题的规范和卷面的整洁提出了更高的要求。同时,《普通高中物理课程标准(2017版)》用“核心
顾客忠诚是保证企业可持续发展的重要因素,而企业良好的社会形象将对顾客忠诚产生积极影响,因此航空公司为了在赢得顾客忠诚的同时获得经济收益,开始关注一种新型的营销模式—善因营销。本研究首先基于民航顾客特征就匹配度、活动类型以及投入度等航空公司善因营销维度进行剖析,并依据“感知—情感—行为”的研究范式,构建反映航空公司善因营销、顾客感知、罪恶感诉求以及顾客忠诚之间逻辑关系的理论模型,进而提出研究假设。最
随着开关电源功率等级的提高和开关频率的逐步提升,对电源可靠性的要求越来越高。仿真是开关电源从参数设计到实际样机之间的重要环节,仿真模型的不精确会带来实验调试时间长、反复测试数据、器件调整增加预算等一系列问题。因此有必要提高仿真的可信度,实现预先高可信评估。本文以Buck变换器为研究对象,研究了由于器件寄生参数、PCB走线寄生参数和不可控因素(工艺水平、温度、电应力等)引起的变换器特性发生改变的现象
具有均匀的外表面高温分布的微燃烧器在许多方面有着重要的应用,例如在微型热光电系统中微燃烧器是该系统最重要的部件。而氢能作为21世纪最具发展潜力的清洁能源,燃烧的能量密度可以达到锂电池的300倍左右、燃烧效率非常高。微燃烧器的燃烧和传热性能的提高是目前提高微能源供给系统的能量密度和能量转换效率的主要手段。在本文的研究中,以微燃烧器作为研究对象,利用数值模拟的方法在燃烧有效的基础上,使传热更加高效的原
玛雍戏剧起源于先民的原始信仰即万物有灵或灵魂崇拜,作为马来半岛上最古老、最复杂的戏剧形式,是马来人最独特的精神象征。马来半岛在不断发展的历史进程中,外来宗教文化尤其是印度教-佛教以及伊斯兰教文化对其的影响颇深,这些影响也体现在玛雍戏剧中。通过查阅文献资料,本文运用宗教社会学和文化人类学的理论与方法探讨玛雍戏剧发展的历史背景和宗教文化背景,分析玛雍戏剧中的宗教文化体现,并运用对比的方法研究玛雍戏剧与
长穗偃麦草(Thinopyrum elongatum)是小麦重要的野生近缘种,属于小麦三级基因源,具有大穗多花、耐旱、抗寒、耐盐、生长势强等诸多小麦不具备的优良性状,是小麦遗传改良中最有价值的优异外源基因供体之一。通过小麦与长穗偃麦草远缘杂交培育附加系、代换系及易位系是利用长穗偃麦草优良特性的重要途径。目前,在普通小麦背景下,已经创建出整套的普通小麦-长穗偃麦草附加系及代换系,但还未有全套的硬粒小