情感增强词向量构建方法及应用

被引量 : 0次 | 上传用户:tonykaier
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络媒体的迅速发展,网络上出现大量文本需要使用自然语言技术对其进行自动分析和处理。情感分析任务作为自然语言处理的一个重要组成部分,是让机器认知网络上语言的一个重要环节。近年来在情感分析任务中,有大量研究者使用基于统计的方法对情感分析任务进行研究。但随着情感分析任务研究的逐步深入,自然语言的非结构性、情感特征的复杂性及机器学习中的维度灾难,给情感分析任务设定了巨大挑战。词向量作为一种能够以较低的维度表现词语中深层次特征的数字表现形式,得到了自然语言处理领域国内外学者的热切关注,是该领域的研究热点。但自然语言处理中一般词向量的训练方法都针对词语的语义信息进行训练,而情感信息与语义信息之间的不同之处,使一般词向量无法直接用于情感分析任务中。针对情感分析任务提出的词向量训练方法还处于起步阶段,且仅有较少的方法用于训练含有情感信息的词向量。本文以词向量在情感分析中的应用为研究对象,通过分析词向量和情感增强概率语言模型的构建方法,将情感信息有效地融入语义信息,提出情感增强词向量模型(Emotion-enhanced wOrd Representation Model,简称为EeDOM)。其次,将模型中的情感增强词向量用于情感极性判别和情感词典构建,用以验证所提模型和算法的有效姓。本文的创新点可以归纳为:1)提出了情感增强词向量模型。首先,根据情感在文本之中的特点,提出适用于词向量训练的情感增强概率语言模型;其次,基于该概率语言模型,对词向量训练算法的输入特征、神经网络算法等多方面进行相应的改进,使其能够用于训练情感增强词向量。2)针对词向量的特点,本文提出了适用于词向量的支持向量机训练算法。该算法解决了句子中词语个数的不确定性与支持向量机需要确定维度之间的矛盾。该算法提出了基于n窗口的训练过程,是N-gram模型特征在SVM中的改进应用,能有效提高情感极性的判别效果。3)提出了基于情感增强词向量的文档情感词典构建算法。该算法基于DBSCAN聚类算法,使用情感增强词向量的余弦距离对文档中的词语进行情感距离上的分析。并以该情感距离构建基于文档的情感词典。本文基于真实数据集(“豆瓣”电影评论网站上的用户评论)做了对比实验。该数据集共包含643,242条评论组成,涉及2,737个电影。实验结果表明,本文所提出的情感增强词向量模型EeDOM能够显著提升情感极性判别任务的准确率:即EeDOM模型的情感增强词向量能够使情感极性判别的Micro-F1指标达到78.93,远远优于现有相关算法;其次,情感增强词向量在情感相似性方面也表现出良好的特性。基于该词向量相似性所构建的情感词典,在情感极性判别中获得有竞争力的效果。
其他文献
<正>阅读点记者的职业成长重在过程,而起点必须是树立职业操守意识,培养职业责任感,并将之内化为一种职业信念。有职业操守才有媒体公信,有职业操守才有记者的良好声誉。新快
目的针对大数据信息时代大交互设计的内涵与外延,发展历程以及研究内容与范围,分析并预估大交互设计在大数据信息时代下的发展趋势,交互设计的方法、流程、架构、模型以及评
<正>西川是朦胧诗浪潮之后出现的最引人注目的几位青年诗人之一。但与大部分第三代诗人不同,他刚登诗坛就能引人注目,不是基于与朦胧诗模式的鲜明对抗,而是另有天地,迅速指向
为研究热定型温度对改性双向拉伸聚酯(BOPET)薄膜性能的影响,对两种热定型温度的BOPET薄膜的结构、结晶度、热效应进行了测试和评估。研究结果表明:BOPET薄膜经不同温度热定
经过了几十年的发展,我们在医疗及制药领域取得了让人瞩目的成绩,实现了覆盖10几亿人的基本的医疗体系,医疗投入占GDP的比重在不断的增加,建立了城镇职工医疗保险和农村新型
近年来,睡眠呼吸暂停综合征逐渐受到重视,其目的是阐述慢性充血性心力衰竭合并中枢性睡眠呼吸暂停综合征机制及治疗进展。
CAD技术发展至今已经日趋成熟,但国内外诸多的CAD软件大多建立在通用应用平台之上,要使CAD软件能针对专业领域方便地解决问题,必须使用CAD二次开发技术。本文叙述了现代CAD的
《文心雕龙.知音》篇集中体现了刘勰的文学批评理论。在该篇中他指出了文学批评中普遍存在的"知音难求"的现象及其存在的原因,探讨了通过"博观"、"六观"和"沿波讨源"的途径实
莫扎特在他生命的最后十年中,与意大利剧作家达·庞特三度携手,谱写了其歌剧创作生涯中最辉煌的乐章。《费加罗的婚礼》、《唐.璜》和《女人心》这三部喜歌剧创造了歌剧史上
目的:总结导师李永康教授治疗原发性骨质疏松症(osteoporosis)的临床经验。方法:运用中医补肾壮骨理论,以补肾益气活血为治则研制成骨疏丸,将400例原发性骨质疏松症患者随机