基于情感词强度极值的情感嵌入模型研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:shengchunquan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在各种自然语言处理(NLP)任务中,文本情感分析是其中一个重要的挑战任务和飞速发展的研究领域。文本情感分析通过一系列方法对主观性文本中的情感成分进行分析、处理、归纳和推理。目前面向中文的文本情感分析方法主要分为基于情感词典的方法和基于机器学习的方法。基于情感词典的方法是利用知识库和语料库,通过不同词语之间的词义关系构建具有褒贬义情感倾向的情感词典。这种方法将词语进行二元(褒义、贬义)或三元(褒义、贬义和中性)划分,构建成的词典在情感强度细分任务上表现粗糙,强度极值差异化程度较大,无法进行细粒度的情感分析。基于机器学习的情感分析方法通常使用神经网络模型将词语转换为有意义的分布式词向量,通过预训练好的词向量(如,Word2vec和GloVe),计算词语间的余弦相似度进行文本情感分析。然而,现有的基于上下文的词向量训练方法,可能导致具有相反情感极性的词语具有相似的向量空间表示(例如“温柔”和“刁蛮”的余弦相似度为0.670398235),导致情感分析性能降低。本文将情感词典与词向量空间模型相结合,提出一个基于情感词强度极值的情感嵌入模型。从情感词典出发,将情感词典与词向量空间余弦相似度结合,计算出每个词语的细粒度情感强度分数。然后利用此强度极值对预训练词向量进行优化,改进每个词向量,使语义和情感上同时相似的词语在词汇表中更加接近(即具有相似情感极值的词语互相接近,具有相反情感极值的词语互相远离)。实验结果表明,本文所提出的优化模型可以为基于情感词典的情感分析任务提供更精确的细化分值。同时改进传统的词嵌入模型,与原始词向量相比,情感嵌入向量中情感反义词出现概率大幅度减少,情感分类效果更好。
其他文献
SiC_p/Al颗粒增强复合材料具有高比模量、高比强度、低热膨胀系数、优异的抗疲劳和耐腐蚀性能,已在航空航天、汽车、电子及军事等领域得到了越来越广泛的应用。但在SiC_p/Al颗粒增强复合材料的切削加工过程中,增强颗粒的存在导致刀具磨损严重,加工表面质量差等一系列问题。本文以有限元仿真技术为主要研究手段,结合实验方法,对SiC_p/Al颗粒增强复合材料的去除机理进行研究,以求提高SiC_p/Al颗
新课程改革提出教育要“以人为本”,要求新时代背景下教师要更新教育理念,转变角色,全面实施素质教育,大力推进教育的创新。作为初中道德与法治教师,在新课程理念的要求下,必须要改进课堂提问,提高课堂教学的实效性。本文的研究范围仅限于初中道德与法治课堂提问,结合部编版初中道德与法治教材,利用生活情境和案例,让学生从中汲取适应社会、解决问题的能力,提升个人品德素质。本文从初中道德与法治课堂提问存在的意义出发
目的研究三氧化二砷与小白菊内酯联合应用于人骨肉瘤细胞U2OS,对其增殖产生的抑制作用。方法培养人骨肉瘤细胞株U2OS作为研究对象,选取不同药物浓度的三氧化二砷及小白菊内酯
用在苄基氯化锡及三丁基氯化锡与4-吡啶甲酸钠反应,分别合成了三苄基锡4-吡啶甲酸酯(1)和三丁基锡-4-吡啶甲酸酯(2),并进行了红外光谱、核磁共振氢谱及质谱表征,X射线单晶衍射分析结果表
中国股票市场自上世纪九十年代初上海证券交易所和深圳证券交易所开始成立至今已经走过了将近30年,虽然在发展的道路上出现了很多挫折,但始终没有停下前进的步伐,有力的支持了中国改革开放起这40年的经济腾飞。但是在此我们也要清楚的认识到中国股票市场仍然是不健全的,尤其是定价方面更是学术界关注的重点。在研究的过程中我们发现西方对于资本定价方面已经形成了相对成熟的理论。从上世纪50年代量化市场风险的经典CAP
中国A股市场投资者热衷于炒作新股的现象长期存在,在新股发行市场上存在显著的IPO高抑价现象。大量投资者抱着获取高额收益的预期,参与新股投机,非理性的投资前期涨幅巨大的新股,但却在股价的回调过程中承受巨大损失。本研究关注新股市场上大量投资者投资行为的短期化现象,结合A股市场新股上市抑价率居高不下的现实,通过研究新股抑价率与在新股打开涨跌停板后的的数个窗口期内的短期收益率之间关系,检验抑价率是否对新股
目的研究针刺治疗阿尔茨海默病(Alzheimer’s disease,AD)细胞骨架相关的细胞生物学机制。方法以SAMP8鼠为阿尔茨海默病动物模型,用Morris水迷宫检测“益气调血,扶本培元”针法对S
目的探讨游离腓动脉穿支皮瓣修复手足部皮肤软组织缺损的临床疗效。方法对2011年4月-2014年2月采用游离腓动脉穿支皮瓣修复的8例手足部皮肤软组织缺损病例进行回顾性分析。切