面向情感分析的词向量学习及其应用

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:masonma
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着用户在互联网上交互模式的变化,微博等社交平台上均包含大量的实时信息及评论,针对这些短文本信息的情感语义挖掘对于公共事件的舆情分析、商业产品的市场营销、突发事件的公共关系处理等方面都有至关重要的作用。  在包含情感分析任务的自然语言处理框架中,由于语言文本的复杂性,将文本及其语义通过数字化表示是其他语言处理任务的基础。作为承载语义的基本单元,词的表示学习,也即词向量的学习成为自然语言处理任务中重要的前置工作。  而现有的词向量模型,往往只考虑局部上下文的信息,并不能表征词语本身的情感语义信息,不适合直接应用于情感分析领域。同时,如何更高效地利用学习得到的融合情感语义的词向量,将其应用于以情感分类为代表的文本情感分析任务中,也是本文要解决的一大问题。  针对上述问题,本文提出了多种面向情感分析的词向量学习模型,并以学习得到的包含情感语义的词向量作为输入特征,提出两种用于情感类分的卷积神经网络分类模型。本文的具体研究内容如下:  (1)针对现有基于局部上下文的词向量模型不能很好地体现情感语义的问题,本文提出了基于强化语义的词向量学习模型,将文档本身作为模型的上下文,实现文档信息与局部上下文信息的整合。实验表明基于强化语义模型学习得到的词向量可以实现性能更好的情感分类,也即证明模型有效地扩充了词向量的情感语义信息。  (2)针对原始词向量模型未使用已标注的情感信息的背景,本文提出了基于外部知识的词向量学习模型,分别将情感标签作为模型的输入和预测目标,实现外部情感知识与原有模型的整合。实验表明,扩展模型学习得到的词向量可以实现更高性能的情感分类。  (3)基于前两部分研究内容,本文提出了融合强化语义与外部知识的词向量学习模型,将表征更大范围上下文的文档信息和情感标注的外部知识共同融合进模型中。实验表明,融合模型的性能优于单独使用一种策略的模型。  (4)以包含情感信息的词向量作为输入特征,本文提出了用于情感分类的单层卷积神经网络模型;同时融合词内部的字信息,提出了结合词内部信息的卷积神经网络。实验结果表明,本文提出的以融合模型的词向量作为输入特征,以结合词内部信息的卷积神经网络为分类器的情感分类处理框架相对baseline的性能有所提升,证明该分类处理框架的有效性。
其他文献
随着互联网的迅速发展,网络协议的安全性越来越成为人们关注的焦点。IEEE802.1X协议作为以太网上主要的接入认证协议,其安全性的重要性显而易见。形式化方法作为一种重要的软
随着多媒体信息技术的不断发展,数字视频技术的应用越来越普遍,尤其是室外的视频监控应用,如道路交通、住宅小区、停车场等。然而逐渐增多的雾、霾等恶劣天气,使得采集到的室外视
荔枝、柑橘采摘效率的提高是提升岭南地区特色水果质量、降低成本的重要途径。农业采收机器人的应用是提高水果采摘效率的有效途径之一。但由于荔枝、柑橘果实形态、颜色、纹
全过程计算机辅助动画自动生成技术是人工智能与多媒体技术相结合的全新动画制作技术,它将电影艺术、人工智能和图形学技术引入动画生成全过程,底层以图形学技术作为支撑,上层运
卫星移动通信系统可以通过提供与地面蜂窝系统兼容的语音和数据服务,来解决传统蜂窝通信系统的业务范围受地理环境和运营成本制约的问题。新一代地球静止轨道卫星通信系统——
随着三维GIS的兴起和发展以及数据采集技术的进步,三维GIS中大规模矢量数据的可视化已经成为当前GIS空间数据可视化所要解决的一个重要问题。而目前,三维GIS中矢量数据的可视化
智能视频监控系统是计算机视觉领域的重要应用,运动目标检测是智能视频监控系统中的关键技术,阴影去除是运动目标检测中的重要环节。本文结合图像亮度归一化和二维交叉熵的思
良好的性能是程序设计开发的重要目标之一。结合硬件平台的系统结构特点,分析程序行为、寻找性能瓶颈是一个重要课题。硬件性能计数器是现代处理器芯片提供的一组专用寄存器
随着计算机技术的发展,系统仿真作为重要辅助分析手段被各航天大国广泛使用,用于提高空间任务设计和运行的质量和效率。然而,空间任务的各组成部分和各运行环节都充斥着大量的不
随着计算机网络技术的飞速发展,互联网已经成为信息获取的重要渠道,越来越多的信息通过网络进行传输和交换。XML作为一种可扩展标记语言,凭借其跨平台、可扩展的优势,被广泛用于