双语情感词汇对齐研究

来源 :江南大学 | 被引量 : 0次 | 上传用户：tonghe135612

【摘要】

：

随着“情感计算”的兴起,人们日益重视主观性文本,并试图应用计算机对这些文本所表达的情感进行自动分析。这催生了一个新兴的、交叉研究领域——情感分析和观点挖掘。前者关

【作者】

：

曹永红

【出处】

：

江南大学

【发表日期】

：

2004年期

【关键词】

：

双语情感词汇 AVS结构双语对齐可比语料库

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着“情感计算”的兴起,人们日益重视主观性文本,并试图应用计算机对这些文本所表达的情感进行自动分析。这催生了一个新兴的、交叉研究领域——情感分析和观点挖掘。前者关注文本所表达的褒贬性,后者侧重研究人们对于事物的观点,例如客户对于产品的、服务、机构的评价。在双语情感分析和观点挖掘中,情感词典是一种十分重要的翻译工具。最常见的情感词典是褒义词和贬义词词典。至今为止,国内外词典学界已经编撰并出版了一系列分别由中文和英文构成的单语种情感词典。中文情感词典包括褒义词词典、贬义词词典和褒贬义词典,例如NTUSD和清华大学构建的情感词词典等;英文情感词典有WordNet、SentiWordNet、LIWC(Linguistic Inquiry and Word Count),ANEW(Affective norms for English words),MPQA(Multi-Perspective Question Answering)等。但是,这类词典具有一个共同的局限性:所列出来的词条往往是孤立地表示某个词的褒贬色彩;一旦进入不同的语境的时候,其极性往往会发生变化。此外,目前市面上仍然缺乏双语情感词典。因此,如何编撰双语情感词典以适应于跨语种的情感分析和观点挖掘?这就成为了语言学家、词典学家和计算机专家一个共同感兴趣的研究课题。从词典学、翻译学的角度来看,双语词典编纂的核心议题是双语对等词的挖掘,即如何将被释义词翻译为另外一种语言中的释义词。本文以形容词为例,研究如何将汉语形容词翻译为对应的英语形容词,核心议题是如何确定所翻译的英语形容词为该汉语形容词的最佳对应词。本文采用的理论框架是认知语言学中的AVS(Attribute-Value Structure)。其中,“A”表示实体(例如产品)的特征;“V”表示这些特征的值,往往由形容词来体现。一方面,AVS是形容词语义表示的基本理论框架;另一方面,与“V”联结的“实体-特征”就成为了该形容词出现的一个微型语境,对于该词语义的精确化起到了极为重要的作用。所应用的语料为中国的淘宝和美国的亚马逊中的客户评价。具体做法是:1)先确定实体为某款手机;2)基于淘宝语料,进一步从中挖掘该手机的特征及其值,获得一个中文的AVS结构,例如“内存-大”;从亚马逊的客户评价中进行相应的挖掘,获得一个英文的AVS结构,例如“memory-big”;3)对齐中英两个AVS结构,我们发现它们具有相同的实体和特征。在此基础上,我们进一步认定“大”和“big”为该领域中的最佳对等词。实验表明,中英AVS结构对齐的准确率达到了80%,表明了该方法具有一定的科学性和可行性。本文的创新之处在于:1)理论上,采用了AVS结构;并从词典学的角度对实体和特征进行了解读,认为它们实质上是形容词在文本中出现的一个微型语境;2)在实践上,鉴于市面上缺乏免费使用的客户评价平行语料,我们创造性地选择了中国的淘宝和美国的亚马逊作为了可比语料。上述研究对于双语词典的编纂具有借鉴意义。一般的做法是会为某个汉语单词配上多个译文即对等词,但是对于哪个对等词是最佳对等词一般缺乏进一步的说明。在本文中,通过上述方法可以寻找到一定语境中的最佳对等词,因此起到了缩小候选对等词数量的作用。这种研究存在以下局限性,并值得进一步的探索。首先,它的试验对象是形容词性情感词汇。对于其他词性的研究是否可用还有待检验。其次,所选用的可比语料为淘宝和亚马逊。是否还有更加具有可比性的语料(库),甚至平行语料库,是一个值得期待的事情。

其他文献

基于Internet的FMS远程监测与故障诊断技术研究

目的 :提高 FMS设备故障诊断和排除的速度 ,加快维修需求的响应能力以及降低停机维修的费用 ,提高全球规范服务能力。方法 :将 FMS设备和监测计算机与 Internet相连 ,利用 L

期刊

FMS故障诊断数据传输VRML专家系统

发展性评价:复杂多变视角下的引入与应用

从引入与应用的角度,通过文献资料、学术交流以及研究体会,重点介绍发展性评价的意义、基本范畴、应用条件,并以基本药物制度政策为例,提出了发展性评价具体应用的思路。 Fr

期刊

发展性评价项目理论实时调整

乡风文明建设的社会责任研究

乡风文明建设能够提升乡民的精神状态，增强乡村的经济能量，凸显乡村的社会地位。尽管近些年乡风文明建设已经获得长足进展，但由于社会责任不明确，导致了乡村文明基础设施严重不足

期刊

乡风文明建设社会价值社会责任

运用统筹法快速计算工程量

工程量是构成工程造价的基础数据，计算工程量是预、结算过程中占用时间最多的一项工作，要提高预、结算工作的速度和质量，必须提高工程量的计算速度，动用统筹法在一定范围内解决了

期刊

预、结算统筹法单位工程工程量

鸡公山自然保护区蔷薇属植物资源调查

在对鸡公山自然保护区蔷薇属植物种质资源系统调查的基础上，研究了鸡公山自然保护区分布的13种蔷薇属植物的分布、储量及主要种类的生物学特征、生境及利用价值。并对鸡公山自

期刊

蔷薇属资源调查鸡公山自然保护区

以情境教学促进小学数学有效教学

传统意义的小学数学课堂上,教师多是机械地传授知识,因此很多学生感觉数学索然无趣。而新课程改革以来,越来越多的数学教师开始尝试教学情境的创设。情境教学能够很好地促进

期刊

DEFGBC

玻璃幕墙安全风险防范研究

伴随着我国建筑行业的不断发展,玻璃幕墙在我国建筑行业的应用也越来越广泛。但随着玻璃幕墙使用年限的增加,其也面临着一些安全风险,比如钢化玻璃自爆、金属连接件失效、粘

期刊

玻璃幕墙安全风险风险防范

品管圈在疼痛患者健康教育中的应用效果

目的探讨品管圈活动在提高癌痛患者健康教育质量中的应用效果。方法选取2017年6月~2017年12月在本科服用止痛药物的癌痛患者为研究对象。按健康教育路径对这些患者进行持续性

期刊

品管圈疼痛健康教育

抽象思维“开化”之“有理数的乘法”的教学

<正>数学学科的最大特点是抽象性,抽象思维是学习数学、学好数学的一种基本方法。而初中生思维正处于由具体形象思维为主,到逐步走向概括抽象思维为主的过渡时期。也就是说,

期刊

有理数乘法法则

行波法在电气化铁道牵引网故障测距的仿真研究

针对牵引网受到机车运行工况变化影响，以及一些不确定性因素导致出现接地故障的缺陷，提出了一种利用行波法对牵引网故障进行测距的应用方案。依据AT牵引网实际电路，在ATP中建立

期刊

牵引变电所故障测距行波

双语情感词汇对齐研究

与本文相关的学术论文