表示学习词向量提取及其在情感分析中的应用研究

来源 :江南大学 | 被引量 : 1次 | 上传用户：a13315157220

【摘要】

：

文本情感分析通过计算机技术自动识别、标注、分类或抽取出自然语言文本中蕴含的主观性内容,从而判断出文本的情感倾向.词表示学习是文本情感分析的关键前提,其核心问题是从

【作者】

：

张明

【出处】

：

江南大学

【发表日期】

：

2019年01期

【关键词】

：

情感分析表示学习词向量提取方面情感分类深度学习

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

文本情感分析通过计算机技术自动识别、标注、分类或抽取出自然语言文本中蕴含的主观性内容,从而判断出文本的情感倾向.词表示学习是文本情感分析的关键前提,其核心问题是从非结构化的文本中获取和解析语义知识,以便从数学角度诠释词所蕴含的深层语义和句法关系,实现机器对自然语言的理解和感知.随着互联网文本表达朝着多渠道、多主题和口语化的方向发展,其蕴含的冗余和动态不确定性对语义的抽象和提取提出了更高的要求,使得情感分析问题变得更为复杂和具有挑战性.鉴于此,本课题以提炼文本上下文为切入点,根据文本语料的统计特性优化现有的词表示学习模型,并将其应用到细粒度情感分析问题上,以下是主要研究内容:(1)由于上下文和词之间存在着距离分布不平衡的问题,本文提出了一种基于显著特征的词向量提取方法.为了最大限度的保留文本信息的真实性和可靠性,该方法设计了一种基于距离的语义相关性准则,并在此基础上根据词的上下文分布为其制定了上下文稀疏性标准,研究了一种确定词的显著特征序列的方法.该方法能够克服文本中存在的歧义、无序和噪声等现象,具有统筹全局信息的优点,实验表明该方法在被运用到现有模型时能够极大地提高其在语义相似度任务上的表现.(2)由于上下文和词之间还存在着位置分布不稳定的问题,本文提出了一种基于精确上下文的词向量抽取方法.为了根据特定语义任务的需求自适应地筛选不同距离和位置变动模式下的上下文信息,该方法通过引入余弦公式强化距离对上下文的缩放效应,尤其是对远距离上下文的抑制作用,并通过统计分析上下文的位置变动模态推导出上下文的分散性度量公式,以此强化在目标词窗口内固定位置频繁出现的上下文以及近似均匀地分布在窗口内的上下文的作用.该方法能够提升上下文对语义的诠释能力,实验表明其在不同语义度量任务上具有很强的灵活性和自适应性.(3)由于传统深度学习模型在解决方面情感分类任务时通常包含方面提取和方面分类等众多复杂的步骤,本文提出了一种基于注意力词向量的方面情感分类方法.为了消除词向量语义空间中固有的多义词语义模糊以及反义词歧义性等缺点,该方法根据注意力机制提出了注意力向量的概念,其中的空间注意子向量旨在衡量空间维度与分类主题之间的相关性,而情感注意子向量旨在确定词的情感属性的重要性;此外,该方法还提出了一种基于细胞自动机的蜂群算法用于深度优化该注意力向量.经过该注意力向量加权后的词向量可以直接作为卷积神经网络的输入用于解决方面情感分类问题,无需改进模型的结构,因此具有普适性和实用性等特点,实验表明该方法在与其他模型相比时显示出很大的优越性.综上所述,本文紧扣表示学习词向量提取及其在情感分析中的应用这一研究课题,采用层层递进地方式展开研究.一方面,根据上下文的距离和位置变动模态等统计信息深入地探讨了提炼上下文信息对词的语义表示的重要性;另一方面,根据词向量空间的特性将语义和空间维度相对应解决方面情感分类问题.希望本工作能够为词的表示学习和文本情感分析的发展提供一些新的思路和参考价值。

其他文献

建筑施工企业税收筹划浅谈

随着我国经济体制改革的逐渐深入,作为宏观调控的重要手段,税收的地位和作用受到越来越多的重视。本文从详尽的案例分析了税收筹划的重要性。作为追求利益最大化的企业,必须

期刊

税收筹划建筑施工企业营业税

福建省人民政府办公厅关于印发我省2006年推进依法行政工作要点的通知

【正】各市、县(区)人民政府,省人民政府各部门、各直属机构,各大企业,各高等院校:《福建省2006年推进依法行政工作要点》已经2006年4月27日省推进依法行政领导小组全体会议

期刊

工作要点直属机构实施行政许可法制机构政府公报管理体制改革备案审查依法行政意识《行政复

全球化时代中国海外移民的新特点

中国新移民指1970年代以来从中国移居国外的公民,他们的移民活动构成第三次中国海外移民大潮。与中国历史上的老移民相比,中国新移民具有大多流向发达国家、高学历者比重大、

期刊

中国新移民精英移民全球化人口流动移民动机

中学英语授课的实践与认识

特定的语言环境,是学好外语的有利条件.中学高中英语教师用英语授课,就是创造这种语言环境的重要方法.这在实践中的意义是多方面的.1能够激发学生学习外语的积极性高中学生经

期刊

中学英语实践与认识高中英语教师

高校体育教学过程中学生心理问题的探讨

通过对当前高校体育教学实践中学生心理的调查总结和研究分析，指出高校体育教学工作的部分阙失和产生的原因，并提出相应的处理方案。

期刊

体育教学心理障碍探讨

微电影风暴来袭

<正>"吴彦祖在一次高科技交易中遭遇敌手中途突袭,为了将新科技安然转送至安全地带,吴彦祖联手女主角Lisa施展调虎离山等计策,几经周折最终成功达成目标",这是凯迪拉克微电影

期刊

微电影凯迪拉克整合营销吴彦祖

提高公众参与环境影响评价有效性的研究

公众参与是促进决策科学化和民主化的重要手段。针对当前我国公众参与环境影响评价存在的诸多问题,本文剖析了问题存在的原因,并从立法、确定利益相关者、完善公众参与方式和

期刊

公众参与环境影响评价有效性

新疆准噶尔盆地侏罗系齐古组凝灰岩SHRIMP锆石U-Pb年龄

报道了准噶尔盆地获得侏罗纪齐古组凝灰岩精确的SHRIMP锆石U-Pb年龄164.6 Ma±1.4 Ma（MSWD=1.3）。该年龄值几乎相当于国际地质年表中Callovian阶的底界年龄（164.7Ma±4.

期刊

准噶尔盆地侏罗系齐古组SHRIMP锆石U-Pb年龄

春运期间客运量下降成因及应对策略研究——以宿迁市为例

2019年春节期间,宿迁市客运量呈现大幅下降态势,与之前年份相比较为异常。文中从客运方式、小汽车保有量、天气原因等多方面入手,对客运量下降的原因做出了分析,并提出了提升

期刊

春运客运量下降成因

福建省人民政府关于长汀县正方水库水源保护区划定方案的批复

【正】龙岩市人民政府: 你市《关于请求批准长汀县正方水库饮用水地表水源保护区划定方案的请示》(龙政综[2007]164号)收悉。根据《中华人民共和国水污染防治法》及其实施细

期刊

水源保护区地表水源实施细则水流域人民群众

表示学习词向量提取及其在情感分析中的应用研究

与本文相关的学术论文