中文文本情绪原因发现研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:dionysos223
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网和社交媒体的快速发展,网络中出现了大量的用户发布的主观性文本。这些文本覆盖了用户对于产品的评价以及民众对于社会热点事件的反应等大量内容,因此自然语言处理领域的意见挖掘、舆情分析和文本情绪分析引起了众多研究者的广泛关注。目前的文本情绪分析相关研究大多集中于文本情绪分类等方面,但缺乏对情绪产生原因的深入研究,因此本文的研究集中在从文本中发现触发情绪产生的原因。目前文本情绪原因发现相关方法主要分为基于规则的方法以及基于统计的方法两类。前者需要人工构建规则库,其完备程度无法保证;而后者往往使用文本情绪表达相关的用词以及短语结构特征,其有效性依赖于大规模的标注语料库。针对现有方法存在的不足,本文分别研究基于记忆网络和基于多核支持向量机的文本情绪原因发现方法,并在此基础上通过集成学习实现对二者的结合,以进一步提高情绪原因发现的性能。本文的主要工作包括两部分:针对现有工作往往忽略情绪表达关键词与情绪原因之间关系的不足,本文研究结合注意力机制的记忆网络。利用网络中的多层注意力计算对于输入的情绪表达关键词与待判断子句之间的关系进行建模,使得网络能够通过注意力机制对于情绪表达关键词所对应的原因文本核心词进行锁定,进而判断出情绪原因所在子句。在EMNLP 2016数据集上的实验结果显示该方法取得了69.55%的F值,相比于基线方法提升了1.99%。考虑到记忆网络能够对文本情绪相关的因果关系进行建模,但忽略了文本情绪原因表达自身的一些特征,本文提取了情绪原因序列特征以及情绪原因句法树特征,将多项式核函数与卷积核函数相结合,构建了一种基于多核支持向量机的文本情绪原因发现方法。在此基础上,设计了一种集成学习的方法,分别将基于记忆网络以及基于多核支持向量机的方法作为基分类器,通过Bagging的方式进行集成。在EMNLP 2016数据集上的实验结果显示,该方法取得的F值相比于基线方法提升了7.69%,达到了目前已知的最高水平。
其他文献
随着云计算的迅速发展,用户开始将数据存储在云服务器上,以节省自身的开销,实现便捷的多点访问。但是云服务器易遭受外部攻击,其本身也并非完全可信。为了保护用户云端数据的
数据可视化是利用计算机图形学和图像处理技术,将数据以图形或图像的形式在屏幕上显示出来,并进行交互处理的理论、方法和技术。现有的数据可视化工具存在可扩展性和易用性不
当今世界已经进入了数字化的时代,蓬勃的市场需求造就了动画电影和电子游戏产业的高度繁荣,也促进了真实感渲染技术的飞速发展。在基于物理的真实感渲染研究领域,至关重要也
近些年来,随着消费级别RGB-D相机的问世和普及,普通用户也能够方便地获取现实生活中各类物体和人物的几何信息。然而真实世界中的物体是丰富多彩的,只有几何形状的三维模型显
随着人工智能的飞速发展,卷积神经网络(Convolution Neural Network,简称CNN)被广泛应用于视觉分析领域,并在图像分类、人脸检测、对象识别、图像变色等方面取得了令人瞩目的
心电信号(ECG)自动分析与诊断是当前信号处理领域的一个研究热点,这一技术能够有效实现能够提高医生效率,促进医疗事业发展和提高人们健康水平。心拍识别作为心电信号自动分
我们提出了一种应用于人脸视频的实时本征分解技术,该技术让用户能够在实况视频中编辑面部外观。在运行之前,用户将编辑应用到参考人脸图像的反照率本征图和亮度本征图,这允
在课堂小组合作学习盛行的当下,同伴互助学习模式显然有其优越性,本文介绍了同伴互助小组的形成、学习内容及考核评价机制,以期提高课堂学习效率,实现"因材施教"的理想。
钢材凭借其诸多优点被广泛应用于建筑结构中。近年来随着我国国民经济和建筑市场的不断发展,国内钢结构的应用范围在不断扩大,建筑钢结构科学技术领域的发展也在不断提高。但建筑科学领域对钢管结构相贯节点极限承载力以及超低周疲劳断裂方面的研究并不充分。本文以圆钢管相贯节点为研究对象,研究思路由简入繁,从平面节点入手,对常见的圆钢管X型相贯节点进行研究。空穴扩张模型(Void Growth Model,简称VG
麦冬Ophiopogon japonicas属多年生常绿草本植物,近年来作为草坪在绿化中应用越来越广泛,杂草在草坪中的发生危害也在逐年加重。草坪中杂草尤其是多年生杂草,如果得不到及时防除,轻则影响草坪观赏效果,重则草坪被杂草覆盖。目前,麦冬草坪中杂草防除的研究较少,为此,本文调查了扬州市主城区麦冬草坪地发生的杂草;评价了36种除草剂茎叶喷雾对麦冬草坪的安全性;通过田间试验筛选了防除麦冬草坪地杂草的