跨语言情感分析方法研究

来源 :武汉大学 | 被引量 : 2次 | 上传用户:zooton2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年来,随着自然语言处理技术和机器学习技术的发展,单语文本的情感分析已得到深入的研究和发展,各种关于词级、超词级、句子级、篇章级的情感分析研究已逐渐趋于成熟。然而,作为情感分析领域的特殊研究任务之一,跨语言情感分析的效果仍未达到人们的预期。其主要原因是不同语言的特征空间之间的不相交性使得关联跨语言间的情感表达存在障碍,进而导致了在跨语言间有效共享跨语言间情感知识面临极大的挑战。为了解决跨语言间情感知识的有效共享问题,因而设计可靠的情感知识共享通道和策略以及构建有效的跨语言间情感表达关联成为了当前跨语言情感分析研究的核心问题。目前跨语言情感分析研究得到了极大的关注也取得了重要的研究进展,但是仍存在一些未完全解决的问题。因此,针对目前跨语言情感分析研究所存在的问题,本文首先从跨语言情感分析研究的一般性策略出发,有针对性地研究了在跨语言间情感知识的的迁移和适应性问题;然后,由跨语言情感分析研究的核心问题出发,研究了一般跨语言情感分析任务的核心问题---跨语言间情感表达关联研究,最后针对具体的跨语言情感分类任务的核心问题---跨语言间情感极性表达的固有差异展开深入地研究。具体研究内容如下:1.协同学习框架中对源语言未标注数据的利用以及情感表征性研究基于协同学习,本文提出一种基于交叉采样与结构情感信息的跨语言情感分析交互学习模型。首先,通过启发式识别方法抽取文本中的情感表达作为结构情感特征,将其融合到传统的n-gram特征空间中,形成情感表征性更强的特征空间;其次,在传统协同学习的框架基础上,我们提出一种交叉采样策略对两种语言视图中的非标注数据的情感知识交互迁移,从而实现将源语言与目标语言进行高效融合学习;最终获得具有更高性能的目标语言情感分类器。实验结果表明:相较于传统跨语言情感分析模型,基于交叉采样和结构情感融合的半监督学习框架可以高效地利用少量源语言标注数据挖掘出大量的未标注数据中的情感知识,从而帮助目标语言学习出更优质的情感分类器。2.跨语言间情感知识的可靠迁移研究跨语言情感分析的主要任务是通过利用源语言情感知识来识别目标语言情感极性。然而,绝大部分的现有方法是基于迁移学习的,由于知识迁移过程可能存在的迁移错误使得它们并未取得理想的效果。本文针对该问题提出在迁移学习模型的迁移过程中引入知识验证模型,从而通过识别出高质量的可靠的知识来减少由错误知识给系统带来的性能影响。实验结果说明本文提出在迁移学习过程中引入知识验证模型的必要性和有效性。3.跨语言间情感表达关联的研究构建跨语言间的情感表达联系是跨语言情感分析方法的基础。现有的绝大部分工作主要集中在一般语义关系的构建上,由于情感语义是一般语义的一个部分,因此,非情感语义可能会对情感知识的学习造成干扰。本文将平行文本共享的极性表达之间的差异看成一种情感关系,提出了利用一个双视图的联合卷积神经网络来捕获跨语言文档之间的情感关系,通过对跨语言情感联系的识别对平行文本的情感极性进行分类。受实体关系学习的启发,我们首先学习了单语的情感表达,然后将单语情感表达分别映射到一个双语的情感关系空间中,利用向量的加权减法来捕获跨语言情感关系。在公开数据集上的测试结果说明了该方法的有效性。4.跨语言间情感极性表达固有差异的学习方法研究由于不同语言表达情感的方式不同,因此发现跨语言间情感极性表达的固有差异是解决跨语言情感关系的一条重要途径。本文将跨语言间情感极性表达的固有差异看成连接跨语言平行文本的情感极性表达的重要关联。通过研究跨语言间情感极性表达的固有关联来分析跨语言平行文本的情感极性。基于此,本文提出了两个基于“迁移”假设的关联学习模型。实验表明了跨语言间情感极性表达关联学习对于解决跨语言情感分析问题的有效性和重要性。
其他文献
目的探讨青少年原发高血压(EH)的发病影响因素及其临床特点,并分析运动干预的效果。方法选择55例14~25岁轻中度EH患者,46例性别和年龄相匹配的健康志愿者作为对照。比较两组
租赁经营是高速公路服务区经营的重要方式,租赁经营涉及诸多税收事项,租赁合同主要涉及印花税和房产税。租赁合同条款设计不同,产生的税收成本也不同。本文以承秦高速公路三
和制汉字对汉语新词有着巨大的影响,一方面和制汉语丰富了汉语新词的语言文化,另一方面促使汉语语言体系的完善。本文以和制汉语的概述作为切入点,阐述和制汉语对汉语新词的
和制汉语是日本人借用汉字创造或翻译出的汉语新词汇。和制汉语对汉语进行了逆向输入并产生了一定的影响。本文从国内外学者对和制汉语的研究现状、和制汉语的产生及特征、和
本刊讯 5月27日,深圳市汇百川卫浴有限公司于上海卓美亚喜马拉雅酒店召开新闻发布会,宣布正式开业。会上,汇百川展示了多款新品,受到到场嘉宾的一致称赞。
广州便利的水陆交通,使得许多广州卫浴企业一直从事着出口贸易。但近两年,受国际经济形势低迷、人民币升值等因素的影响,部分企业开始向国内市场发展,广州卫浴五金品牌——帝朗卫
本文以2006年10月~2012年9月中国人民银行的沟通实践为样本,采用EGARCH模型检验我国中央银行沟通对金融资产价格的影响。实证结果显示:(1)中央银行沟通对金融资产价格有一定
本刊讯 2010年12月,笔者走访兰州各大卫浴卖场时发现,有许多品牌店开始进行内部装修,以全新的形象迎接2011年元旦的到来。
走出解决企业资金紧缺问题的误区中国人民银行调查统计司李跃企业资金紧是因为银根紧,要解决企业资金紧张问题,就应该放松银根。这似乎已成为一种解决企业资金紧张的思维定势。
数字媒介革命把中国网络文学推向了当代文学变革的历史前台。中国网络文学在作者与读者双重大众化、交互性文学生产方式、数据库写作等方面取得了一定的成就和突破,但总体上